Baixe o app para aproveitar ainda mais
Prévia do material em texto
PSICOMETRIA [presencial] 959W MÓDULO (1) Embora, a estatística e a matemática sejam ciências importantes à Psicometria, diferente do que muitos acreditam, elas não são sinônimas. Enquanto o objeto de estudo das primeiras são conceitos numéricos, o da Psicometria são fenômenos psicológicos que podem ser apresentados numericamente (Pasquali, 2003). Neste sentido, o estudo epistemológico da Psicometria é importante, pois permite contextualizá-la, fundamentá-la e ao mesmo tempo identificar a relação existente entre essas ciências. Por esta razão, o Módulo I deste estudo é sobre a Origem e História da Psicometria. Saiba que, a disciplina não tem por objetivo a memorização dos nomes de todos os estudiosos do assunto nem de todas as datas relevantes que são citadas na literatura. Contudo, algumas referências como Spearman, Galton, Cattell e Binet não podem ser esquecidas. Por isto, entre os exercícios colocados neste módulo, vocês encontrarão alguns como este: No início do século XX, alguns psicólogos delinearam teorias sobre a inteligência e, a partir delas, muitas contestações, reformulações e perspectivas teóricas que possibilitaram a construção de instrumentos de medida. Abaixo, vocês encontrarão algumas afirmações que relacionam estes delineamentos e reformulações com pesquisadores. Leia com atenção cada uma das afirmações, analise se são verdadeiras ou falsas e depois assinale a alternativa correta. I. De acordo com Spearman, que propôs a teoria bi-fatorial, o ‘fator g’ estaria subjacente a todas as atividades intelectuais e o ‘fator s’ representaria a variação intelectual entre as pessoas. II. Galton em seus trabalhos propunha a avaliação das aptidões humanas por meio da medida sensorial. Contudo, concluiu que medidas objetivas para investigar funções mais complexas não produziam bons resultados. III. Catell desenvolveu nesta época, um modelo de análise extremamente importante para o desenvolvimento dos testes psicológicos: “a análise fatorial múltipla”. IV. No início do séc. XX Binet e Simon desenvolveram um teste de inteligência cujos itens permitiam investigar habilidades específicas, tais como, a de realizar cálculos. a) As alternativas (I), (II) e (III) são afirmações verdadeiras. b) As alternativas (II), (III) e (IV) são afirmações verdadeiras. c) As alternativas (I), (III) e (IV) são afirmações falsas. d) As alternativas (II), (III) e (IV) são afirmações falsas. e) As alternativas (I), (II) e (III) são afirmações falsas. Neste exercício a alternativa correta é a (d), ou seja, a única afirmativa verdadeira é a número (I) dado que realmente a teoria bi-fatorial foi proposta por Charles Spearman. Quanto às outras afirmativas, elas são todas falsas. A afirmativa (II) salienta o trabalho de Galton sobre medidas sensoriais. De fato, ele procurou parametrizar as dimensões ideais dos sentidos, pois considerava que toda a informação humana tinha seu canal de entrada via sentidos. No entanto, a conclusão sobre as medidas objetivas para investigar as funções complexas foi de James McKeen Cattell. Thurstone foi quem desenvolveu a análise fatorial múltipla e não Catell, como consta na afirmativa (III). Com relação à sentença (IV) o erro está na afirmação de que o teste de Binet e Simon investigava habilidades específicas. Uma das críticas feita por eles que motivou a elaboração de um novo instrumento foi a de que os testes de inteligência estavam direcionados a investigação de algumas poucas habilidades e não para a análise das funções cognitivas. Neste primeiro módulo você terá, ainda, a oportunidade de fazer uma reflexão crítica sobre a Psicometria empirista e a Psicometria de concepção estatística. Para tanto, é fundamental que leia atentamente a revisão histórica em: PASQUALI, L., Psicometria – Teoria dos testes na psicologia e na educação. Petrópolis. Vozes. 2004. cap.1. Este capítulo aborda a história da Psicometria a partir do final do séc. XIX e salienta dois olhares distintos a respeito desta ciência, o prático e o teórico. Os psicólogos voltados à prática da Psicometria eram os que se preocupavam mais com o aspecto psicopedagógico e clínico, pois se interessavam pela predição do potencial acadêmico. Já os psicólogos voltados à teoria eram os que se interessavam pela ciência psicométrica. Estas duas vertentes, tempos depois, convergiram à chamada Psicometria Clássica. Sobre estes olhares, vocês encontrarão algumas questões como a seguinte: A Psicologia enquanto ciência tem sua história ligada a várias tendências epistemológicas. Entre estas duas correntes científicas se destacaram no início do séc. XX, a Psicologia alemã e a Psicologia inglesa e norte-americana. A primeira voltada ao estudo das experiências subjetivas enquanto a outra ao estudo do comportamento. Dito isto, fica fácil concluir que: a) A Psicologia alemã pode ser denominada empirista, tendo em vista a preocupação com o estudo das experiências subjetivas. b) A Psicologia inglesa e norte-americana voltada ao estudo do comportamento buscava qualificar as características humanas. c) A Psicologia introspectiva atenta à qualidade dos testes psicológicos usava procedimentos quantitativos nas análises. d) Os paradigmas empiristas da Psicologia alemã referiam-se a medição das experiências subjetivas dos indivíduos. e) Os paradigmas empiristas da Psicologia inglesa e norte- americana referiam-se a medição de comportamentos. Ao analisar as afirmativas colocadas nesta questão verifica-se que a única que está correta é a alternativa (e). As quatro primeiras estão incorretas, pois a Psicologia alemã ao contrário do que fora afirmado era introspectiva, estava interessada na experiência subjetiva e utilizava procedimentos mais descritivos. Quanto à Psicologia inglesa e norte-americana, empirista, interessavam-se pela quantificação do comportamento humano. Neste módulo, você encontrará também algumas questões que se referem a pessoas e épocas importantes na história da Psicometria. Marcada por psicólogos ímpares os períodos relevantes dessa história são conhecidos como as eras de: Galton (1880), Catell (1890) e Binet (1900). Por suas importâncias é significativo conhecer um pouco do percurso de cada um deles. Você poderá encontrar um breve relato na referência citada. Além destes períodos há outros que devem ser ressaltados, quais sejam, as décadas dos testes de inteligência (1910-1930), da análise fatorial (1930), da sistematização (1940-1980) e atualmente, da Psicometria Moderna ou era da TRI (Teoria de Resposta ao Item). A fim de compreender melhor o que representou e representa a história da Psicometria para a avaliação psicológica atual é importante estabelecer a relação entre o trabalho desenvolvido em cada era e o momento histórico mundial em que ocorria. Por isto, você encontrará em: PASQUALI, L. e cols. Instrumentação psicológica: Fundamentos e Práticas. Porto Alegre. Artmed. 2010. 11-47 p., fatos marcantes da medida psicológica inseridos em um contexto histórico. Neste sentido, alguns dos exercícios aqui colocados têm a intenção de fazê-los refletir sobre esta relação. Como exemplo, cito a seguinte questão: No campo da instrumentação psicológica e industrial, o início do séc. XX ficou marcado por grandes inovações. Provavelmente, o dia mais importante para a história do automóvel foi o dia primeiro de outubro de 1908. Nesta data Henry Ford produzira com padronização e linhade montagem, a primeira unidade do Ford Modelo T conhecido no Brasil como Ford de Bigode. Nesta mesma época, Alfred Binet lançou a segunda edição do Teste Binet-Simon (instrumento utilizado para analisar o desempenho intelectual), desta vez utilizando o conceito de Idade Mental. Estes dois fatos históricos sugerem que: a) A necessidade de mão de obra especializada na indústria levou o governo Frances a preocupar-se com o desempenho acadêmico das crianças, investindo nos testes de inteligência. b) O conhecimento adquirido na indústria com a padronização do Ford de Bigode serviu de modelo para a padronização do desempenho escolar das crianças francesas. c) Binet e Simon com seu teste de inteligência e Henry Ford com a linha de montagem preocupavam-se, respectivamente, com a qualidade dos resultados produzidos na avaliação de inteligência e na linha de montagem. d) Henry Ford, Binet e Simon decidiram realizar normatizações em suas áreas, pois com a guerra (Iª GM) iminente, as capacidades de produção de carros e seleção de soldados geravam grandes preocupações. e) O instrumento de avaliação de Inteligência criado por Binet e Simon e a linha de montagem adaptada de um matadouro de gados por Henry Ford são resultantes de validações estatísticas. A resposta correta a este exercício é a letra (c). Tanto Alfred Binet quanto Henry Ford reviram seus procedimentos, de modo a torna- los mais eficientes. Para tanto, utilizaram como princípio a padronização do instrumento de avaliação de inteligência e da montagem do carro Ford de Bigode. Como consequência a qualidade dos produtos - desempenho intelectual e automóvel - melhorou sensivelmente. Quanto às alternativas (a), (b), (d) e (e) estão todas incorretas. A alternativa (a) porque a motivação não fora a necessidade de mão de obra especializada, mas sim, a necessidade de identificar possíveis causas para o insucesso escolar de algumas crianças. A (b) não está certa, primeiro porque não foi o desempenho escolar que foi padronizado, mas sim o teste, depois porque um não serviu de modelo ao outro. No caso do automóvel, a ideia de padronizar a montagem do Ford de Bigode surgiu após uma visita em um matadouro de gado. Quanto ao teste, os conhecimentos estatísticos da época e a necessidade de torna-lo mais eficiente é que motivaram as alterações. Com relação à alternativa (d), os relatos históricos não fazem qualquer referência a mudanças operacionais da indústria automobilística Ford nem ao desenvolvimento de testes psicológicos por Binet em decorrência da Iª GM. A afirmativa (e) sustenta que ambas as situações são decorrentes de validações estatísticas, o que é um erro. O objetivo da linha de montagem era carros padronizados, mais baratos e em maior número, pois nesta época o ideal de felicidade americano era ter um carro na garagem de casa. MÓDULO (2) De acordo com Pasquali (2010) a medida em psicologia, a Psicometria, é uma parte da ”Teoria da Medida”, portanto, não pode ser entendida como sinônimo desta última. Possivelmente, a interpretação distorcida advém do fato de que a Psicometria utiliza símbolos matemáticos para compreender os fenômenos naturais. A Psicometria se constitui na interface entre dois sistemas de conhecimentos bem distintos: a matemática, cujo objeto de estudo é um conceito - os números - e a ciência empírica que estuda os fenômenos da realidade. Neste módulo você vai observar que o encontro feliz entre a ciência empírica e a matemática possibilitou uma análise mais precisa de fenômenos naturais, bem como, a manipulação da realidade em estudos que não poderiam ser realizados de outra forma. A título de exemplo, cito o estudo sobre os efeitos de um vazamento nuclear na população que vive ao entorno de uma usina. Jamais seria possível realiza-lo, eticamente, se não tivéssemos como manipular a realidade. Apesar das vantagens deste encontro, a natureza da medida também implica em dificuldades. A primeira delas a representação dos fenômenos naturais com números. A segunda, a precisão da representação e a terceira, o indicador do erro provável. Para compreender melhor o que isto significa você encontrará explicações em PASQUALI, L. e cols. Instrumentação psicológica: Fundamentos e Práticas. Porto Alegre. Artmed. 2010. p.56-78. Uma pergunta necessária é se há validade no uso de números como descritores de fenômenos naturais. O estudo da base axiomática da medida dará uma resposta positiva a esta questão. No passado, você já deve ter estudado as propriedades numéricas, identidade, ordem, aditividade e seus postulados. Porém, a fim de fundamentar melhor a validade epistemológica da medida nas ciências humanas, será necessário revisá-las. A propriedade denominada Identidade define o conceito de igualdade ou de que um número é igual somente a ele mesmo. A propriedade chamada Ordem sustenta a desigualdade entre os números, em outras palavras, a de que um número é diferente do outro em termos de qualidade e magnitude. E, por último, a Aditividade, que se refere à possibilidade dos números serem somados e produzirem outro diferente deles, exceto quando um deles for o número zero. Sobre estes axiomas você encontrará algumas questões, como a seguinte, que lhe ajudarão a estudar. “A Fuvest divulgou na tarde desta sexta-feira, 4, a terceira chamada de seu vestibular. Foram convocados 1.113 estudantes para matrícula, no dia 11 de março, na Universidade de São Paulo (USP) e na Faculdade de Ciências Médicas da Santa Casa de São Paulo.” (Jornal Estado de São Paulo, 03 de março de 2011) “Sudoku é um quebra-cabeça que tem por objetivo a colocação lógica de números. Apesar de possíveis variações, para solucionar o problema é necessário colocar números de 1 a 9 nas células vazias de uma grade de 9x9 subdividida em regiões de 3x3. Cada linha, coluna ou região pode ter apenas um número de 1 a 9.” Considerando os seguintes dados: na primeira lista de aprovados na Fuvest, publicou-se a nota de cada aluno sem os critérios de desempate e no Sudoku o número colocado em uma determinada célula não é sempre o mesmo, pois varia dependendo do jogo, leia as afirmações abaixo e assinale a alternativa que nomeia o axioma do sistema numérico corretamente. a) A classificação dos candidatos que realizaram a Fuvest e os números colocados nas células do Sudoku exemplificam o axioma aditividade. b) A classificação dos candidatos na Fuvest e os números colocados nas células do Sudoku exemplificam o axioma identidade. c) Os números colocados nas células do Sudoku exemplificam o axioma aditividade e o axioma denominado ordem. d) A classificação dos candidatos na Fuvest exemplifica o axioma ordem, mas não exemplificam o axioma identidade. e) Os números colocados nas células do Sudoku exemplificam o axioma identidade, mas não exemplificam o axioma aditividade. A alternativa correta a esta questão é a (d). A alternativa (a) está incorreta, porque nenhum dos dois são exemplos de aditividade. No caso da Fuvest o número indica a classificação do candidato. Sabe-se que dois ou mais candidatos podem ter a mesma nota e, portanto, ocupar a mesma classificação. No caso do Sudoku os números são símbolos sem qualquer representação matemática, portanto não são exemplos de axioma do sistema numérico. A afirmativa (b) também está errada. Os números a que se refere o exercício são os de classificação e não os de identidade do candidato e, no Sudoku o número é apenas um símbolo não representando o sistema numérico. Com relação à letra (c) e (e) os números não exemplificam tais axiomas. Os axiomas citados, quando aplicados às ciênciashumanas, nem sempre se sustentam. Um exemplo que ilustra bem isto são os afetos. Não é possível pensar que a angústia de um sujeito é igual a do outro. Pasquali (2010) explica a possibilidade do atributo de um objeto natural variar, exemplificando que o aroma de uma rosa é diferente de outra, mas nem por isto deixam de ser rosa. Assim, no caso das ciências humanas quanto mais axiomas do número estiver presente na medida, mais uma se aproximará da outra. Pode-se dizer então que, a diferença de axiomas presentes em cada uma das escalas numéricas de medida e as invariâncias delimitam a escala e a estatística apropriada. Leia mais sobre isto em: PASQUALI, L., Psicometria – Teoria dos testes na psicologia e na educação. Petrópolis. Vozes. 2004. p.33-36. Há três diferentes formas de realizar a medida de um atributo: medida fundamental, medida derivada e medida por teoria (leis e teorias científicas). No caso das ciências psicossociais, em sua maioria, os atributos são mensuráveis se fundamentados em leis ou teorias científicas. A medida por lei está baseada na relação entre a resposta e o estímulo e é comumente utilizada na análise experimental do comportamento. Segundo Pasquali (2010. p.71) “Mede- se por lei quando se quer demonstrar empiricamente que dois ou mais atributos estruturalmente diferentes mantêm entre si relações sistemáticas”. Quanto à medida por teoria, inicialmente ressalta-se que não é uma lei, dado que a lei se constitui de fatos empíricos enquanto a teoria, de axiomas ou postulados. Na psicologia a medida por teoria pode ter vários enfoques, entre os quais, dos jogos, da psicofísica e psicométrico. A teoria dos jogos utiliza como parâmetros a probabilidade e a utilidade, a teoria psicofísica o estímulo e a resposta e a teoria psicométrica ou teoria dos testes psicológicos o comportamento do sujeito e o critério. Vale ressaltar que, sendo o critério compreendido de diferentes formas há duas teorias decorrentes: a teoria clássica dos testes (TCT) e a teoria de resposta ao item (TRI). A primeira compreende o critério como o comportamento futuro do sujeito, já a outra o traço latente (Pasquali, 2010; 2004). Entre os exercícios apresentados neste módulo haverá alguns como: No caso da questão acima a alternativa correta é a letra (a). Nas alternativas (b), (c), (d) e (e) as correspondências estão erradas. A teoria fundamental é usada em atributos de massa, comprimento e duração temporal que permitem uma medida direta e fundamental. A medida derivada é expressa em termos de medidas fundamentais, ou seja, ela é medida indiretamente, por meio das que são fundamentais. A medida por teoria não é uma lei e suas hipóteses são testadas empiricamente. A medida por lei ocorre quando os atributos são diferentes em sua natureza, mas apesar disto há uma relação sistemática entre estes. Com relação à Teoria da Medida falta observar ainda que sendo a medida uma expressão empírica é impossível evitar o erro. Conforme explicitado por Popper (1972)[1], “dois pontos ‘físicos’- um sinal no instrumento de medição e outro no corpo a ser medido – (...) não podem fundir-se em um ponto”. Se esta fusão for ampliada será possível observar algumas diferenças e estas serão maiores ou menores dependendo do intervalo de aumento utilizado. Em outras palavras, quanto mais aumentada for a imagem maior será o erro. Por isto, os pesquisadores apresentam o valor da medida e seu erro provável. Observe então que, o número em medida significa um intervalo e não um conceito precisamente claro e distinto. Em psicometria os erros podem decorrer da observação (instrumental, pessoal, sistemático ou aleatório) ou da amostragem. A questão abaixo ilustra alguns dos exercícios que fazem parte deste módulo. A resposta correta para esta questão é a alternativa (c), pois o controle dos erros de medida de tipo instrumental decorre de observação realizada com instrumentos que se encontram inadequados para o uso. A forma de conter melhor este tipo de erro é a calibração dos equipamentos. A afirmativa (a) está errada, pois o erro de tipo sistemático é um erro de observação e não de amostragem. A letra (b) também está incorreta. O erro de amostragem de tipo aleatório não tem causa conhecida, assim observações diárias não seriam formas eficientes de controle. O controle adequado para este tipo de erro é feito por teorias como a de probabilidade. A alternativa (d) salienta que os procedimentos adotados eliminam as possibilidades de erros, o que não é real. O erro está sempre presente em qualquer medida, por isto só é possível controla-lo. Quanto a incorreção da afirmativa (e) o controle do erro de tipo pessoal que decorre das diferentes formas de reação dos indivíduos é dado por treinamento e manutenção da atenção. [1] POPPER, K. R. A lógica da pesquisa científica. Cultrix. São Paulo. 1972. p.135 [2] THOREN, V. E. The comet of 1577 and Tycho Brahe’s system of the world. Archives Intenationales d’Histoire des Sciences, 29, p. 53-67, 1979 Módulo (3) - Estatística Aplicada à Testagem Como visto no módulo (1) o desenvolvimento no campo da testagem psicológica se deu com a criação de boas ferramentas de avaliação. Para tanto, foi necessária a aplicação de conhecimentos matemáticos e estatísticos. Por esta razão, o Módulo (3) abordará conceitos básicos da Estatística Aplicada à Testagem. De início você deverá ser capaz de definir o que são variáveis e constantes. Como a própria palavra diz variável é qualquer coisa modificável e constante tudo o que sempre se mantém da mesma forma, ou seja, que não varia. Frequentemente nos deparamos com variáveis, no entanto, com constantes é muito mais difícil. A razão entre a circunferência e o diâmetro de um círculo é um exemplo de constante e cor de olhos e personalidade exemplos de variáveis. As variáveis podem ser classificadas de várias formas entre elas as denominadas discretas e as contínuas, esta última mais comum na testagem psicológica. Você poderá ler e estudar sobre variáveis e constantes em: URBINA, S., Fundamentos da Testagem Psicológica. Porto Alegre. Artmed. 2007. p.45-46. No módulo (2) você pôde revisar as propriedades dos números. Agora revisaremos os níveis de mensuração, ou seja, as escalas que tratam do modo como os números podem ser usados. São quatro as escalas: nominais, ordinais, intervalares e de razão. A escala nominal usa os números para identificar indivíduos ou classes; a ordinal identifica e ordena uma série hierárquica; a escala intervalar adiciona a estes o uso de intervalos iguais entre as unidades, contudo sem o zero verdadeiro e a escala de razão que considera o zero verdadeiro, isto é, um número que significa nenhuma quantidade. Você poderá ler e estudar sobre as escalas em: URBINA, S., Fundamentos da Testagem Psicológica. Porto Alegre. Artmed. 2007. p. 45-50. Para verificar sua compreensão a respeito destas escalas, encontrará algumas questões como esta: Em um jornal desportivo, no dia 07 de março de 2011, foi noticiado que o espanhol Rafael Nadal mantinha sua liderança do "ranking" da ATP. De acordo com eles no top-20 não houve qualquer alteração. Na Copa Davis realizada em Portugal, Frederico Gil continuava sendo o melhor português no "ranking” (85.º lugar). Esta notícia, aos olhos da Psicometria pode exemplificar a escala: a) Nominal porque os números revelam a classificação de cada um dos tenistas. b) Ordinal porque os tenistas são ordenados de acordo com seu desempenho nas partidas oficiais. c) Intervalar porque a posição ocupada pelos tenistas revela a distância entre eles. d) Ordinal porque os números utilizados no ranking dos tenistas da ATP são arbitrários. e) Nominal porque os tenistas são organizados em umranking, de acordo com a pontuação do jogador. A resposta correta para esta questão é a afirmativa (b), pois na escala ordinal os indivíduos podem ser organizados de acordo com a característica que desejamos medir, porém não há uma constante intervalar. As outras afirmativas estão incorretas. Na escala nominal os números são usados de forma arbitrária como símbolo de identificação e a escala intervalar mensura a distância entre dois números quaisquer que podem ser ordenados de acordo com as características medidas. Na testagem psicológica o uso de números para representar objetos ou eventos é frequente. Por isto o conhecimento da estatística é fundamental. A estatística descritiva, como a própria palavra diz, usa números e gráficos para descrever, sintetizar ou representar dados e a estatística inferencial, baseada na teoria da probabilidade, utiliza os números para realizar estimativas. Seu principal objetivo é estimar parâmetros populacionais a partir de dados amostrais. Os parâmetros, diferente das medidas procedentes de populações, são derivados de dados de amostras e são matematicamente exatos. Como exemplo, têm-se as médias, desvios padrões, coeficientes de correlação, entre outros. Também serão revisadas neste módulo as medidas de tendência central e medidas de variabilidade. Você poderá estudar mais sobre estes temas em URBINA, S., Fundamentos da Testagem Psicológica. Porto Alegre. Artmed. 2007. p.52-59, antes de realizar os exercícios deste módulo, como o apresentado a seguir: Segundo Urbina (2007), “a mensuração está no centro da testagem psicológica como atividade científica (...) e envolve o uso de certos dispositivos ou regras para atribuir número a objetos ou eventos.” Apesar disto alguns estudos brasileiros indicam que os psicólogos usuários dos testes conhecem pouco os parâmetros psicométricos para julgar a qualidade dos instrumentos que usa. As afirmações que seguem abordam temas da psicometria. Analise cada uma delas e assinale a alternativa correta. I. As variáveis discretas, aquelas com uma gama finita de valores, apesar de na prática serem passíveis de erro, em princípio podem ser calculadas precisa e acertadamente. Por esta razão, tempo distância e temperatura são consideradas variáveis discretas. II. Na testagem psicológica, na maioria das vezes, estamos interessados em variáveis contínuas, ou seja, as que podem teoricamente ser subdivididas infinitamente. Graus de introversão ou de ansiedade são exemplos de variáveis contínuas. III. Os resultados da maioria dos testes psicológicos são expressos em números que devem ser analisados relativamente. Desta forma, os dados brutos devem ser resumidos e transmitidos por meio da estatística descritiva. IV. A estatística inferencial permite condensar os dados através de vários procedimentos desde uma simples distribuição de frequências até os mais sofisticados métodos de correlação entre muitas variáveis; V. A estatística inferencial permite que os dados apresentados na estatística descritiva sejam analisados e julgados à luz dos conhecimentos da teoria psicológica o que possibilita a utilização das conclusões em diferentes contextos, pessoas ou grupos. A partir da análise das afirmações acima assinale a alternativa correta: a) Somente as afirmações (I) e (II) estão corretas b) Somente as afirmações (II) e (III) estão corretas c) Somente as afirmações (III) e (IV) estão corretas d) Somente as afirmações (IV) e (V) estão corretas e) Somente as afirmações (V) e (I) estão corretas A resposta correta a este exercício é a alternativa (b). A afirmativa (I) está incorreta, porque, apesar da definição estar certa, o exemplo citado está incorreto, dado que não ilustram cálculos precisos. A afirmativa (IV) está incorreta, pois a estatística inferencial é baseada em estimativas e não em descrever, condensar ou representar dados. A frase número (V) está errada, dado que a relação de dependência entre estatística inferencial e descritiva não é verdadeira. Desta forma, somente as afirmativas (II) e (III) estão corretas. No primeiro caso, porque na testagem psicológica as mensurações realizadas não são totalmente precisas, o que explica também a razão da afirmativa (III) estar correta. Conforme salientado, os números na testagem psicológica devem ser compreendidos de forma relativa. Outros temas que serão revisados neste módulo são as medidas de tendência central, as medidas de variabilidade e o modelo de curva normal, também conhecida como curva do sino. Esta é uma distribuição (curva normal) cujos resultados se concentram mais no centro e se dispersam mais nas extremidades. No eixo X (horizontal) estão as unidades de desvio padrão. Por ser um modelo matemático de distribuição ideal o eixo vertical não precisa ser mostrado. Segundo Urbina (2007) “Como todos os modelos ideais, a curva normal não existe, baseia-se na teoria da probabilidade.” É importante que você conheça e compreenda as principais propriedades do modelo da curva normal, assim como seus usos. As distribuições não normais também deverão ser estudadas, pois as distribuições que diferem podem ter implicações relevantes para a análise dos dados. Vale ressaltar que as características das distribuições de escores delimitam uma forma específica para a curva que pode ser diferente da curva normal. Identificar esta diferença na fase preliminar do estudo é fundamental para a realização dos ajustes necessários. Abaixo você verá um exemplo de questão que retrata esta diferença e sua implicação. Este tipo de questão você poderá encontrar ao longo de seu estudo. Uma professora de psicologia resolveu analisar os resultados obtidos por seus 160 alunos na avaliação bimestral, a fim de orientá-la no planejamento de suas aulas. Para tanto, analisou a distribuição de frequência das notas, ou seja, o número de vezes com que cada nota ocorreu e, em seguida, traçou a curva de distribuição representativa dos resultados. A curva de distribuição de frequência apresentada foi a seguinte: ! Tomando esta como base e o texto sobre a intenção da professora, ao analisar o resultado obtido, esta concluiu que curva era: a) Negativamente assimétrica; o que significa que a maioria dos alunos obteve notas altas. b) Negativamente simétrica; o que significa que a maioria dos alunos obteve notas baixas. c) Positivamente assimétrica; o que significa que a maioria dos alunos obteve notas baixas. d) Positivamente assimétrica; o que significa que a maioria dos alunos obteve notas altas. e) Positivamente simétrica; o que significa que a maioria dos alunos obteve notas altas. A resposta correta para esta questão é a letra (a), pois a curva apresentada difere da curva normal; é assimétrica porque a maior parte de seus valores encontra-se na extremidade superior da escala, e a distribuição é negativa, tendo em vista que a cauda mais longa se estende na direção da extremidade inferior. Desta forma, as alternativas (b), (c), (d) e (e) estão incorretas em decorrência da nomeação e/ou interpretação da distribuição dos escores não corresponderem ao representado na figura. Você também poderá ampliar seu estudo lendo, PASQUALI, L. e cols. Instrumentação psicológica: Fundamentos e Práticas. Porto Alegre. Artmed. 2010. p.116-135. Módulo (4) - Estatística Aplicada à Testagem - Psicometria Moderna Este módulo continua tratando da Estatística Aplicada à Testagem, porém desta vez o assunto principal é o modelo da Psicometria Moderna, ou seja, a Teoria de Resposta ao Item, que de agora em diante será chamada apenas por TRI. Embora a TRI tenha uma longa história foram os trabalhos de Lord (1953;1953) e Rasch (1960) que a introduziram na testagem psicológica. Mas, foi a partir da década de 80, quando os programas computadorizados ficaram mais acessíveis, que a TRI passou a predominar nos estudos sobre testes psicológicos. A TRI tem causado grande impacto nos estudos psicométricos, principalmente porque tem superado limitações da Psicometria Clássica que até então pareciam improváveis. Entre as limitações ultrapassadas salienta-se: (1) dependência dos parâmetros de itens na amostra; (2) dependência do teste utilizado; (3) definição conceitual de fidedignidade ou precisão; (4) orientação da Teoria Clássica para o teste total e não para o item. Estas dificuldades e a compreensão da TRI sobre elas são melhor explicadas no livro PASQUALI, L., Psicometria – Teoria dos testes na psicologia e na educação. Petrópolis. Vozes. 2004. p. 79-107. Você também poderá verificar seus conhecimentos sobre o assunto respondendo as questões deste módulo. Como exemplo destas perguntas verifique a seguinte: A Teoria de Resposta ao Item (TRI) surge para oferecer alternativa às dificuldades encontradas pelos psicometristas com os modelos e técnicas clássicas de medida. As afirmativas apresentadas se referem aos modelos da psicometria clássica e moderna. Analise cada frase e assinale a alternativa que salienta somente a compreensão da TRI. I) A dificuldade e a discriminação dos itens devem estar sujeitos a amostra de indivíduos, porque desta forma, a partir da relação estabelecida, possibilitarão a representatividade da população. II) Para que a avaliação da aptidão e do desempenho seja igual em todos os níveis é preciso que a teoria ofereça uma medida de precisão para cada aptidão ou desempenho. III) A definição do conceito de fidedignidade em um dos modelos teóricos fundamenta-se na correlação entre resultados quantitativos obtidos no estudo de formas paralelas de um teste. V) O desempenho em uma tarefa é explicado em relação a uma série de fatores ou traços latentes, ou seja, pela compreensão de que o desempenho é o efeito e os traços latentes a causa. a) As afirmativas (I) e (II) salientam a compreensão da TRI b) As afirmativas (I) e (III) salientam a compreensão da TRI. c) As afirmativas (I) e (IV) salientam a compreensão da TRI. d) As afirmativas (II) e (III) salientam a compreensão da TRI. e) As afirmativas (II) e (IV) salientam a compreensão da TRI. A resposta correta é a alternativa (e), pois as afirmativas (I) e (III) são leituras do modelo clássico da psicometria. A primeira aborda os parâmetros clássicos dos itens, ou seja, a amostra-dependente. A terceira afirmativa descreve o conceito clássico de fidedignidade. Conforme dito anteriormente, a TRI focaliza sua análise no item e não no teste como um todo. Assim para que todos os níveis de resultados de uma avaliação de aptidão ou desempenho sejam semelhantes é necessária medida de precisão para cada um deles, aptidão ou desempenho. Com relação à afirmativa (IV) ela é um axioma da TRI, a qual observa que indivíduos com maior aptidão têm maior probabilidade de acerto. Em continuidade, neste módulo você também poderá revisar os principais pressupostos teóricos da TRI: unidimensionalidade e independência local. A unidimensionalidade postula que só uma aptidão ou traço latente é responsável pela realização de um conjunto de tarefas ou itens. Com relação à independência local a compreensão parece um pouco mais difícil, contudo, este pressuposto afirma que, se as aptidões que afetam o teste forem mantidas, as respostas aos outros itens serão estatisticamente independentes. De outra forma, o desempenho de uma pessoa em um determinado item não interfere no seu desempenho posterior em outro item, ou seja, os itens de um teste não dão dicas para o sujeito responder acertadamente os outros itens. Leia mais em PASQUALI, L., Psicometria – Teoria dos testes na psicologia e na educação. Petrópolis. Vozes. 2004. p.79-107. Um exemplo de questãos sobre os pressupostos da TRI é: No dia 09 de novembro de 2010, no portal G1 do Globo.com foi publicada a seguinte manchete: “Entenda como funciona a Teoria de resposta ao Item, TRI, usada no ENEM.” A reportagem, decorrente dos problemas ocorridos durante a aplicação das provas, salientava que não havia necessidade de construir uma nova avaliação a todos os candidatos. Alguns especialistas emitiram parecer dizendo que a aplicação da TRI no ENEM garantia o equilíbrio das provas. O parecer dos especialistas fundamenta-se em que pressuposto: a) Independência local, dado o fato de que se um estudante é diferente do outro haverá várias aptidões a serem consideradas. b) Unidimensionalidade, porque todas as questões do ENEM têm níveis de dificuldades diferentes. c) Nos dois, dado que os itens do ENEM são estatisticamente independentes e tem dois parâmetros controlados. d) Unidimensionalidade e independência local, porque as questões têm pesos iguais. e) Nenhum deles, dado que a TRI não se aplica à construção de provas como ENEM ou ENADE. A resposta a esta questão é a alternativa (c). A TRI utilizada no ENEM faz com que o nível de dificuldade dos exames sejam os mesmos. Em outras palavras, as questões são independentes, tem seu grau de dificuldade e de discriminação (resposta certa ou errada) controlados, o que é possível somente se os dois pressupostos forem considerados. A alternativa (a) está incorreta porque a justificativa não é condizente com a teoria de resposta ao item. A alternativa (b) está errada, pois na TRI se pressupõe que as questões devem ter o mesmo nível de dificuldade. A letra (d) porque para ser fundamentada na TRI as questões deveriam ter pesos diferentes, dependentes de suas propriedades. Por último, a letra (e) também está errada porque a TRI se aplica a provas como ENEM ou ENADE. A Curva Característica do Item (CCI) visualmente tem a forma de um S, dado que representa a probabilidade de se responder a um item de forma certa ou errada. Esta probabilidade vai de Zero (resposta errada) a 1 (resposta certa). Outro ponto que os exercícios permitirão revisar são os modelos da TRI, ou seja, os parâmetros utilizados para expressar a relação de probabilidade de sucesso em um item e a aptidão medida pelo teste. São três os parâmetros predominantes para descrever o item: modelo logístico (1) que só avalia a dificuldade do item; modelo logístico (2) que avalia a dificuldade e a discriminação e modelo logístico (3) que avalia a dificuldade, a discriminação e a resposta correta dada ao acaso. Mas, estes parâmetros constituem só uma das etapas na elaboração de instrumentos psicológicos dentro da TRI. Há três níveis de procedimentos, o teórico, o empírico e o analítico que serão objeto de estudo durante o desenvolvimento do projeto de construção do instrumento de avaliação psicológica. Sobre estes assuntos você encontrará algumas perguntas que lhe ajudarão a estudar. Para exemplificar, um exercício ilustrativo: O gráfico abaixo ilustra uma Curva Característica do Item (CCI) de um modelo logístico de três parâmetros. As letras “a”, “b” e “c” indicam cada um dos parâmetros (dificuldade do item, discriminação e resposta dada ao acaso). Leia as alternativas e assinale a que apresentar todas as correspondências corretas. Modulo (5) _ Fidedignidade Este módulo salientará a Fidedignidade dos testes que pode ser referenciado por diferentes nomes. Ao longo de seus estudos, vocês encontrarão textos que utilizarão as palavras confiabilidade e precisão, além de fidedignidade e, alguns outros, que se referem à técnica utilizada, como, estabilidade, equivalência, consistência interna e constância. No entanto, fidedignidade significa “medir sem erros”, ou seja,significa que os resultados de um teste fidedigno, ainda que utilizado para medir os mesmos sujeitos em momentos diferentes deve ter resultados idênticos. Todavia, considerando que o erro está sempre presente, a análise da precisão de um instrumento mostra somente o quanto este teste se afasta do ideal e não o ideal propriamente dito. A fidedignidade sob este ponto de vista fornece estimativas que auxiliam o clínico a avaliar o risco de erro que está relacionado ao teste. Segundo Bunchaft (2002), toda mensuração está sujeita a erros de medida, de tal forma que se pode entender que o “Escore observado = Escore verdadeiro + Escore de erro” Entende-se então que a fidedignidade de um teste verifica o quanto o resultado obtido por um determinado sujeito em um teste se aproxima de seu verdadeiro desempenho. Para compreender melhor o que isto significa leia, PASQUALI, L., Psicometria – Teoria dos testes na psicologia e na educação. Petrópolis. Vozes. 2004. p192-225. E complemente seus estudos lendo BUNCHAFT, G.; CAVAS, CST, Sob Medida: Um guia sobre elaboração de medidas do comportamento e suas aplicações. São Paulo. Vetor Editora; 2002. p51-68. Como forma de exercitar e avaliar sua compreensão sobre este tema encontrará questões como a que segue: "Segundo Pasquali, para estimar a fidedignidde de um testes há três tipos de procedimentos para coletas de dados, quais sejam: I) uma amostra de sujitos, um mesmo teste e uma única ocasião II) Uma amostra de sujeitos, dois testes e uma ocasião III) Uma amostraa de sejeitos, um mesmo teste em duas ocasiões IV) Duas amostras de sujeitos, dois testes em três ocasiões V) Duas amostras de suajeito, dois testes e uma ocasião Assinale a alternativa que estiver INCORRETA: a) I para a técnica do coeficiente Alfa b) II para a técnica do coeficiente Beta c) I para a tecnica Duas metades d) III para a técnica Teste-Reteste e) II para a tenica Formas paralelas. A alternativa correta é a (B)." As fontes de variância de erros são três: estabilidade no tempo, generalidade de amostragem dos itens e homogeneidade dos itens (Bunchaft, 2002). A estabilidade temporal refere-se à constância dos resultados de um teste mesmo que realizado em momentos, ocasiões, diferentes. O quanto estes resultados são influenciados por variações diárias e casuais. A generalidade de amostragem dos itens refere-se à relação entre os resultados de um teste e a seleção de itens, bem como, a homogeneidade dos itens à medição da mesma habilidade, função ou conhecimento. Na Teoria Clássica dos Testes (TCT) “o coeficiente de fidedignidade é definido estatisticamente como a correlação entre os escores dos mesmos sujeitos em duas formas paralelas de um teste.” (Pasquali, 2009, p.193) Segundo Pasquali (2009) há três tipos de procedimentos experimentais para se obter informações sobre a precisão dos testes e dois modelos de análises estatísticas. Os procedimentos são: (a) teste e reteste; (b) formas paralelas, e (c) duas metades e as análises estatísticas, a correlação e a variância. Neste módulo você também poderá avaliar seus estudos resolvendo questões como a seguinte: "São métodos para o cálculo do Coeficiente de fidedignidade: a) Formas paralelas, teste-reteste, TRI, correlação linear de Pearson, método das duas metades. b) Teste-reteste, formas paralelas, método das duas metades, correlação linear de Pearson c) Teste-reteste, correlação linear de Pearson, método das metades, validade de conteúdo, índice de facilidade. d) Teste-reteste, método das metades, erro padrão de medida, validade de conteúdo. e) Método das metades, erro padrão de medida, índice de facilidade, correlação linear de Pearson. A alternativa correta para esta questão é a alternativa (B). a alternativa (A) Teoria de Resposta do Item, como o próprio nome diz, é um olhar teórico da psicometria e não um coeficiente. Da mesma forma os itens (C) e (E) também comtém esta alternativa, conudo não é um coeiciente. Além disto a alternativa (C) conta ainda com um índice de validade e não de fidedignidade. As afirmativas (D) e (E) salientam o erro padrão de medida, que também não é um coeficente de fidedinidade. Por isto, as alternativas (A), (C), (D) e (E) estão incorretas. A correlação expressa o nível de relação que existe entre dois dados que foram obtidos por um dos três procedimentos citados. Quanto aos coeficientes alfa (variância) eles verificam a consistência interna do teste aplicado uma única vez em uma amostra de sujeitos. Em outras palavras, a análise da variância verifica se os itens de um determinado instrumento são congruentes. Existem alguns fatores que contrafazem a fidedignidade de um teste, quais sejam, a variabilidade da amostra e o comprimento do teste. Na Teoria Clássica dos Testes (TCT) a correlação é influenciada pelo tamanho da amostra. Assim, aumentando a variabilidade aumenta também o índice de fidedignidade. Quanto ao comprimento do teste, quanto maior o número de itens maior será a precisão. Neste módulo você encontrará ainda questões que salientam o que Bunchaft (2002) denominou “Fatores que afetam a Fidedignidade do Teste”, ou seja, os fatores relativos ao teste, a interdependência dos Itens, objetividade da correção, dificuldade dos itens, homogeneidade do teste, como dito no início, Defeitos Técnicos na Elaboração do Teste, possibilidade de acerto casual, fatores relativos ao aplicador, fatores dispersivos durante o teste, e fraude na realização do mesmo. A questão abaixo ilustra alguns dos exercícios que fazem parte deste módulo. 'Segundo Guenia em “Sob medida: Um guia sobre elaboração de medidas do comportamento e suas aplicações” a definição de fidedignidade é: a) A fidedignidade ou precisão de um teste refere-se à consistência de resultados obtidos pelos mesmos sujeitos em diferentes ocasiões ou com diferentes conjuntos de itens equivalentes. b) Fidedignidade consiste na constância de resultados de um teste em diferentes ocasiões e nas diferentes formas de aplicação. c) Fidedignidade é quando observamos a concordância de resultados obtidas por métodos muito diferentes em um mesmo grupo. d) Fidedignidade é verificar se os itens são inteligíveis para o (estrato) habilidade da população meta. e) Fidedignidade é utilizada para verificar se o que o sujeito apresentou durante a reaização da testagem é válido. A alternativa correta é a (a), dado que fidedignidade ou precisão, como a própria palavra aponta é o recurso estatístico utilizado para verificar se o resultado do teste é ou não consistente. As outras alternativas não relacionam-se corretamente ao conceito de Fidedignidade. Módulo (6) - Validade MÓDULO (6) Para as ciências sociais este parâmetro é acrescido à fidedignidade, principalmente, na análise da qualidade dos instrumentos de avaliação psicológica. Seu objetivo é verificar se a medida é congruente com a propriedade do objeto que se pretendeu examinar, ou seja, se realmente mediu aquilo a que se propôs. Assim, este módulo consistirá de formulações objetivas sobre os tipos de Validade (conteúdo, critério e construto), delineando cada um deles, especialmente a Validade de construto. Para tanto, em seus estudos você precisará ler o capítulo 6 do livro PASQUALI, L., Psicometria – Teoria dos testes na psicologia e na educação. Petrópolis. Vozes. 2004. p158-191, além de complementá-lo com a leitura do mesmo tema no livro GUENIA, B; CAVAS, CST, Sob Medida: Um guia sobre elaboração de medidas do comportamento e suas aplicações. São Paulo. Vetor Editora; 2002. p69-85. A história dos parâmetros da Validade passa por três períodos, cada qual indicando o predomínio de um de seus tipos. O primeiro, denominado Validade de Conteúdo ocorreu entre o ano de 1900 e 1950. Épocaem que a ênfase era dada aos traços de personalidade, porém com pouca fundamentação empírica. O segundo entre os anos de 1950 e 1970, o período da Validade de Critério, teve como abordagem central o behaviorismo skinneriano. Diferente da anterior esta foi uma época importante para a psicometria porque possibilitou verificar se o “teste predizia com precisão uma futura ou outra condição”. (Pasquali, 2004. p.160). A partir da década de 1970, deu-se início o terceiro e último período o da Validade de Construto, ou seja aquele que se preocupa com os traços latentes ou construto. Para verificar se o conhecimento sobre estes períodos está adequado você terá a oportunidade de realizar uma série de exercícios como o que é apresentado a seguir: Leia as afirmativas abaixo e assinale a alternativa correta sobre o Conceito de Validade. I) É usar o mesmo instrumento de medida que seja reproduzível e significativo. II) Informa a ordem relativa dos objetos, do tamanho das diferenças entre estes objetos e o Z escore. III) É a avaliação, se a escala ou o teste tem uma boa consistência interna. IV) Quando se observa a concordância de resultados obtidos por métodos muito diferentes no mesmo grupo. a) As afirmativas I e II estão corretas b) As afirmativas I e III estão corretas c) As afirmativas II e IV estão corretas d) As afirmativas I e IV estão incorretas e) As afirmativas II e III estão incorretas. A resposta para esta questão é a alternativa (e), ou seja, considerando que a única afirmativa correta é a (IV), a primeira está incorreta porque tanto a afirmativa I quanto a II estão erradas. A alternativa (b) também está errada porque as afirmativas I e III estão incorretas. Com relação às alternativas (c) e (d), nos dois casos a afirmativa IV está correta, porém tanto a I quanto a II estão erradas. Embora a Validade nos faça pensar em um conceito único devemos compreendê-lo não como unidade, mas sim como produto de uma multiplicidade de critérios que podem servir a um objetivo de avaliação, mas não a outro. Por isto, atualmente os pesquisadores interpretam-na como “evidências de validade” e não como validade. Assim, de acordo com Urbina (2000), este conceito deve ser compreendido como “o grau no qual as interpretações obtidas dos dados empíricos do teste encontram sustentação em base científica sólida.” Para se chegar às evidências de validade de um teste passa-se por algumas dificuldades durante os períodos de fundamentação teórica, coleta, análise estatística da informação. Por isto, os psicometristas utilizam-se de um modelo trinário - validade de construto, conteúdo e de critério - para demonstrar a validade dos instrumentos. Embora, ainda utilizado, atualmente há um grupo de pesquisadores que questionam este modelo. A validade de Construto ou de Conceito é a forma mais direta de se “verificar a hipótese da legitimidade da representação do comportamento dos traços latentes” (Pasquali, 2004. p.164). Tem por objetivo principal verificar se cada item que compõe o teste é adequado para medir as características do que se quer avaliar. Um exemplo de questão que você poderá encontrar sobre Validade de Construto é: Leia as alternativas abaixo que abordam a validade de construto e assinale a aquela que não corresponde a este conceito. a) Trata-se da extensão em que podemos dizer que o teste mede um traço. b) Cada construto é desenvolvido para explicar e organizar consistências de resposta observada. c) Em nenhum momento os escores-totais dos sujeitos são utilizados. Todas as estatísticas utilizadas, para a validade de construto, baseiam-se apenas relações inter-item. d) Deriva-se de inter-relações estabelecidas entre medidas comportamentais. e) Requer acumulação gradual de informações de várias fontes. A alternativa que você deve ter assinalado é a (c). Em outras palavras, além da investigação da consistência interna do teste, também se pesquisa o erro de estimação e a análise por hipótese. Vale lembrar que como todas as técnicas de análise da validade de um teste apresentam dificuldades é recomendável utilizar mais do que uma técnica para demonstrar a validade de construto. A Validade de Conteúdo indica se o item que compõe o teste é adequado para representar as características do que se quer avaliar. De acordo com Pasquali (2004) “um teste tem validade de conteúdo se ele constitui uma amostra representativa de um universo finito de comportamentos (domínio)”. Para tanto, é necessário especificar o teste antes de iniciar a construção dos itens.em outras palavras, definir o conteúdo, os objetivos alvos da avaliação e a proporção de representação de cada tema no teste. Desta forma, pode-se dizer que esta validade estará praticamente garantida a partir da sua construção. Quanto à Validade de Critério pode-se dizer que investiga o grau de eficácia para predizer um desempenho específico. Este deve ser medido por meio de técnicas independentes. Há dois tipos de validade de critério: (a) validade preditiva, cujas coletas de respostas a um teste ocorre em momentos distintos e distantes um do outro e (b) validade concorrente, quando a coleta das respostas ocorre quase que no mesmo tempo. Um exemplo de pergunta, ainda sobre validade é: O teste de Validade de Conteúdo consiste: a) Na correlação entre os resultados no teste e no critério. Sua determinação é derivada de um embasamento teórico. b) Consiste em utilizar um ou mais grupos diferentes quando a variável que se pretende avaliar, esperando que entre eles haja uma diferença significativa que não possa ser atribuída ao acaso. c) No exame sistemático do conteúdo do teste a fim de assegurar a representatividade dessa amostra, isto é, que todos os aspectos fundamentais do comportamento sejam, adequadamente e em proporções corretas. d) Utilizada pela técnica de validação convergente-discriminante. e) É um modelo positivista, pois fundamenta-se exclusivamente nos dados empíricos coletados de um conjunto de itens agrupados. A alternativa correta é a (c). Módulo (7) - Normatização O tema Normatização e Padronização, trata das condições fundamentais para a aplicação de testes psicológicos, direitos dos sujeitos que se submetem a eles e as normas a respeito de como se deve interpretar os escores resultantes de uma aplicação de teste. Os critérios de referência baseados no desenvolvimento, nas normas intragrupo e os referenciados no julgamento externo. Iniciaremos com o propósito maior da normatização e padronização, ou seja, a necessidade de manter a uniformização de todos os procedimentos no uso dos testes psicológicos. Neste sentido, o estudo em questão abordará desde a uniformidade das condições de aplicação do teste até a de sua correção. Alguns autores diferenciam padronização (uniformidade na aplicação dos testes) de normatização (uniformidade na interpretação dos resultados). Embora, a nomenclatura favoreça esta distinção, a literatura sobre psicometria, na maior parte das vezes, não o faz. Desta forma, você encontrará os dois termos como equivalentes, embora não estejamos falando da mesma coisa. Desta forma, dividiremos esta apresentação em duas, a primeira sobre a padronização e a segunda sobre a normatização. Como dito anteriormente, a padronização de um teste refere-se às condições de aplicação dos testes psicológicos, ou seja, a atenção dada à coleta de dados. Mesmo que o teste seja muito bom como tal se a aplicação não for cuidadosa poderá produzir resultados inválidos. Por isto, padronizar as condições de testagem significa garantir a eficácia de seus resultados. Para que um teste seja bem aplicado é preciso estar atento para o material e o ambiente da testagem. Para garantir a qualidade do material é necessário atentar a duas condições: a da qualidade do teste propriamente dito e sua pertinência. Nestesentido, o instrumento deve ser válido, preciso e relevante. Este estudo abordará algumas questões sobre este tema, como por exemplo, o que trata do material do teste. Neste sentido você encontrará algumas perguntas como a que se segue: Com relação ao material de testagem, leia as afirmativas avalie se estão certas ou erradas e assinale a alternativa correta. I) O teste que não utiliza os parâmetros de validade e precisão são considerados irregulares. II) O psicólogo que usar testes sem atentar aos seus parâmetros de qualificação será considerado eticamente irresponsável. III) Desde que garantida a validade e precisão do teste psicológico ele poderá ser utilizado em toda e qualquer avaliação IV) O nível de escolaridade do analisando não interfere na escolha do instrumento de avaliação psicológica V) Em uma seleção de motoristas amadores é importante utilizar testes que analisam raciocínio dedutivo. a) As afirmativas I e II estão corretas b) As afirmativas II e III estão corretas c) As afirmativas III e IV estão corretas d) As afirmativas IV e V estão corretas e) As afirmativas I e V estão corretas. A alternativa correta é a (a), pois as afirmativas (III), (IV) e (V) estão erradas. A afirmativa III está incorreta porque mesmo garantindo a validade e precisão nenhum teste serve para toda e qualquer avaliação. O aplicador deverá ter conhecimento sobre o que permite investigar um determinado instrumento psicológico. A afirmativa IV também está incorreta, dado que é preciso verificar se o nível de escolaridade exigido pelo instrumento está de acordo com o apresentado pelo sujeito. Por último, a afirmativa V está errada, tendo em vista que raciocínio dedutivo não se justificaria para tal cargo. Com relação à aplicação dos testes psicológicos, no que se refere ao ambiente de testagem, pode-se dizer que o treino profissional é fundamental ao uso de tais instrumentos. A padronização destes implica em regras para suas aplicações. Neste sentido, o profissional que utilizar de tais recursos deverá seguir os procedimentos de aplicação, atender aos direitos dos testando, controlar os vieses do aplicador e garantir que sejam respeitadas as normas de divulgação. De acordo com Pasquali (2004) “a normatização diz respeito a padrões de como se deve interpretar um escore que o sujeito recebeu num teste”. Por isto, para que possa ter sentido é preciso relacionar o escore a um padrão ou norma. A norma de interpretação é estabelecida por três padrões, quais sejam: (1) de desenvolvimento; (2) intragrupo, e (3) critério externo. Normas de desenvolvimento fundamentam-se no fato de que o desenvolvimento humano é progressivo ao longo da vida. Por isto, pode ser usado como critério de norma, a idade mental, a escolaridade e o estágio de desenvolvimento. As normas intragrupo utiliza como parâmetro o grupo para o qual o teste foi construído. Em outras palavras, o resultado do sujeito só tem sentido se comparado com uma amostra representativa desta população. Para tanto, pode ser referenciado em percentil e em desvio padrão (z). Um exemplo de exercício para o estudo dirigido deste tema é: Um escore bruto produzido por um teste necessita ser contextualizado para poder ser interpretado. Desse modo, qualquer escore deve ser referido a algum padrão ou norma para adquirir sentido, tal como a norma intragrupo. Assinale a alternativa que NÃO aponta para uma definição da norma intragrupo: a) Nas normas intragrupo, o escore do sujeito toma sentido em relação aos escores dos sujeitos da população. b) O critério de referência dos escores é o grupo ou a população para a qual o teste foi construído. c) Para sabermos o significado do resultado de um sujeito em um teste, devemos conhecer os resultados da população como um todo. d) As normas intragrupo são referenciadas em termos da posição do percentil ou do desvio normal. e) Nas normas intragrupo, as normas são estabelecidas sobre uma amostra representativa de uma população. A resposta para esta questão é a (c), pois nem sempre as normas podem ser obtidas através da aplicação da população geral. Por vezes, devemos obter uma amostra representativa da população. Com relação às normas referentes ao critério, esta difere da anterior denominada normas referentes a grupo, por estar interessada na variabilidade ou gama de habilidades. De outro modo, pode-se dizer que a norma referente ao critério está interessada em diferenciar o mais forte do mais fraco em uma habilidade específica ou o nível de habilidade adquirido por um determinado sujeito. O mesmo pode ocorrer com nível de aprendizagem e traços de personalidade. Na TRI a normatização é dada pelo nível de teta (?) que define a probabilidade de um determinado sujeito acertar um item específico. Nem sempre as normas a serem utilizadas podem ser as da curva normal ou percentílica, muitas vezes é preciso utilizar as normas referentes a um critério que é definido teoricamente. Este pode ser ilustrado pelo domínio da aprendizagem, pois após o aprendizado de um determinado conteúdo espera-se que os alunos se distribuíam em uma curva diferente da normal, dado que o objetivo da educação é o de que todos os alunos dominem o conteúdo. Esta curva é chamada curva J. Analise esta questão: Nem sempre desejamos comparar o escore de um sujeito com relação ao um grupo normativo e, assim, as normas referentes a grupo não respondem nossa expectativa de análise do desempenho do sujeito. Assim, quando desejamos decidir se alguém atingiu ou não certo nível de habilidade, de aprendizagem ou de traço de personalidade, utilizamos a norma referente a critério. Leia as proposições abaixo e assinale a alternativa INCORRETA: I - Um psicólogo que efetua avaliação de seleção em recursos humanos de uma determinada empresa para o cargo de segurança pode decidir pré-selecionar candidatos que apresentem controle de impulsividade encontrado em 20% da população, ou seja, o desejo é selecionar candidatos com grau ótimo de controle de impulsividade, o qual é observado em poucas pessoas. II - Na avaliação escolar, pode-se esperar que um aluno consiga resultado de 70% de aprendizado do conteúdo ministrado em aula; caso não atinja este critério de aprovação, ele será reprovado. III - Um psiquiatra estava interessado em investigar o nível do sintoma ‘ansiedade’ de um paciente com baixa tolerância a frustração, pois acreditava que este sintoma estava prejudicando sua vida pessoal e profissional. Para verificar o grau de severidade do sintoma utilizou um questionário de ansiedade, no qual oito respostas “sim” dentre dez perguntas da escala indicaria nível patológico de ansiedade, determinando este critério para distinguir entre normalidade e patologia. IV - O teste WISC-III de inteligência pretende aferir o quociente intelectual de crianças entre seis anos e seis anos e onze meses de idade. O resultado bruto é convertido em ponto ponderado, do qual se pode depreender o QI. Sabendo que o QI de um determinado sujeito é 80, podemos inferir que ele possui 80% da inteligência que se pode aferir neste teste. Assinale a alternativa CORRETA: a) Apenas as proposições I, II e IV estão corretas. b) Apenas as proposições I, II e III estão corretas. c) Apenas as proposições II e IV estão corretas. d) Apenas as proposições II e III estão corretas. e) Apenas as proposições I e IV estão corretas. A alternativa correta para esta questão é a (b). A proposição IV está incorreta, pois o QI é distribuído na curva normal (portanto refere-se à normas por grupos) e não na curva J (da norma referente à critério). Nem sempre desejamos comparar o escore de um sujeito com relação ao um grupo normativo e, assim, as normas referentes a grupo não respondem nossa expectativa de análise do desempenho do sujeito. Assim, quando desejamos decidir se alguém atingiu ounão certo nível de habilidade, de aprendizagem ou de traço de personalidade, utilizamos a norma referente a critério. Leia as proposições abaixo e assinale a alternativa INCORRETA: I - Um psicólogo que efetua avaliação de seleção em recursos humanos de uma determinada empresa para o cargo de segurança pode decidir pré-selecionar candidatos que apresentem controle de impulsividade encontrado em 20% da população, ou seja, o desejo é selecionar candidatos com grau ótimo de controle de impulsividade, o qual é observado em poucas pessoas. II - Na avaliação escolar, pode-se esperar que um aluno consiga resultado de 70% de aprendizado do conteúdo ministrado em aula; caso não atinja este critério de aprovação, ele será reprovado. III - Um psiquiatra estava interessado em investigar o nível do sintoma ‘ansiedade’ de um paciente com baixa tolerância a frustração, pois acreditava que este sintoma estava prejudicando sua vida pessoal e profissional.Para verificar o grau de severidade do sintoma utilizou um questionário de ansiedade, no qual oito respostas “sim” dentre dez perguntas da escala indicaria nível patológico de ansiedade, determinando este critério para distinguir entre normalidade e patologia. IV - O teste WISC-III de inteligência pretende aferir o quociente intelectual de crianças entre seis anos e seis anos e onze meses de idade. O resultado bruto é convertido em ponto ponderado, do qual se pode depreender o QI. Sabendo que o QI de um determinado sujeito é 80, podemos inferir que ele possui 80% da inteligência que se pode aferir neste teste. Assinale a alternativa CORRETA: a) Apenas as proposições I, II e IV estão corretas b) Apenas as proposições I, II e III estão corretas. c) Apenas as proposições II e IV estão corretas. d) Apenas as proposições II e III estão corretas. e) Apenas as proposições I e IV estão corretas. ALTERNATIVA CORRETA: B: A proposição IV está incorreta, pois o QI é distribuído na curva normal (portanto refere-se à normas por grupos) e não na curva J (da norma referente à critério). Módulo (8) - Equiparação de Escores Este é o último modulo do programa de estudos de psicometria e dará subsídios para verificar se compreendeu bem o como se compara resultados obtidos por um sujeito em mais de uma forma de um mesmo teste. Serão abordados o conceito de equalização, os três modelos de delineamentos para a coleta de dados e os conceitos básicos sobre os métodos de equiparação (equiparação linear, não-linear e dentro da TRI). A equiparação também chamada equivalência tem como objetivo tentar solucionar a dificuldade que encontramos para comparar resultados obtidos pelo mesmo sujeito em instrumentos diferentes. É um processo estatístico que possibilita a conversão de um sistema de unidade a outro. Em outras palavras, permite que resultados obtidos por um sujeito em dois testes diferentes sejam comparados e expressos. Este processo estatístico requer delineamentos (como são coletados os dados a serem equiparados) na coleta de informações, em especial os do tipo: (a) um único grupo contrabalançado – grupo randômico e duas formas do teste, (b) grupos equivalentes – dois grupos randômicos e um teste, e (c) teste de ancoragem – dois grupos, dois testes e um teste de ancoragem. (Pasquali, 2004. p. 262) O modelo de grupo único contrabalançado é utilizado quando dois ou mais instrumentos são aplicados em uma mesma amostra de sujeitos. Neste caso é utilizado o procedimento em espiral para evitar efeitos de sequência, ou seja, dois cadernos de testes, (1) e (2), ambos com forma A e forma B, porém um começando com a forma A outro com a forma B. A um grupo aleatório de sujeitos é distribuído os cadernos alternadamente, de modo que o primeiro sujeito receberá o caderno (1), o segundo o caderno (2), o terceiro o (1) e assim sucessivamente. Desta forma, é possível controlar a ordem de apresentação das formas do teste. Para avaliar sua compreensão a respeito deste modelo, você encontrará exercícios como o que se segue. Leia as afirmativas abaixo sobre o modelo de grupo único contrabalançado e assinale a alternativa correta: I) Este modelo é caracterizado pelo controle da ordem de apresentação das formas do teste, sendo as duas equivalentes. II) O objetivo principal do formato em espiral é verificar o efeito de ordem de apresentação. III) Este modelo investiga os efeitos de ordem de apresentação e as diferenças reais nos resultados das duas formas. IV) Para que o procedimento em espiral funcione é necessário distribuir os sujeitos na sala sistematicamente, ou seja, menino, menina, menino, etc. a) As afirmativas I e II estão corretas b) As afirmativas II e III estão corretas c) As afirmativas II e IV estão corretas d) As afirmativas I e III estão corretas e) As afirmativas II e IV estão corretas. Para esta questão temos como alternativa correta a letra (d). A afirmativa II está incorreta, pois o objetivo do modelo não é somente verificar o efeito de ordem como também identificar as diferenças reais existentes entre os dois modelos. A afirmativa IV também está errada, porque ao contrário do que se coloca, para que o resultado seja bom é necessário que os sujeitos estejam dispostos na sala aleatoriamente. O modelo que utiliza os grupos randômicos é formado por dois grupos de sujeitos aleatórios que recebem cada qual uma única forma do teste, ou seja, o primeiro grupo recebe uma das formas do instrumento e o segundo grupo, a outra. Embora este possa utilizar o procedimento em espiral, difere do anterior, porque não exige que os sujeitos respondam as duas formas. Os grupos são independentes e por esta razão só respondem a uma delas. A vantagem desta forma de delineamento está na redução do tempo de aplicação e redução do cansaço dos sujeitos. O outro modelo de delineamento utilizado é o de grupos não-equivalentes com teste de ancoragem, o que é considerado mais apropriado para a equiparação de escores. Semelhante ao anterior consiste em dois testes aplicados no mesmo momento em duas amostras distintas de sujeitos. A diferença está no fato que os dois testes apresentam entre seus itens alguns que são idênticos, ou seja, há questões dentro dos dois testes que são iguais. Veja a questão que se apresenta a seguir sobre o modelo de grupos randômicos e não-equivalentes com teste de ancoragem. Com relação aos modelos de delineamento de coleta de dados é correto afirmar: a) A desvantagem do modelo de grupos randômicos está no fato de que cada grupo responde a somente uma forma do teste, o que torna seu resultado viciado. b) No modelo de grupos randômicos os sujeitos são distribuídos sistematicamente na sala. c) Os grupos não-equivalentes dois testes distintos são aplicados sendo um numa amostra e outro em nova amostra de sujeitos. d) O delineamento mais utilizado, o de grupos não-equivalentes com teste de ancoragem utiliza dois testes (1) e (2) com alguns itens idênticos. e) Tanto o modelo de grupos randômicos quando o de grupos não- equivalentes utilizam distribuição sistemática de sujeitos. A afirmativa correta é a (d). A alternativa (a) está incorreta porque responder a uma única forma de teste é uma vantagem e não uma desvantagem. A (b) e a (e) são alternativas também incorretas, pois nenhum destes delineamentos são feitos com distribuição sistemática de sujeitos. A alternativa (c) está incorreta porque os dois testes são aplicados nos dois grupos. Para a equiparação entre dois testes utiliza-se equações lineares, não-lineares e equiparação dentro da TRI. Os métodos lineares postulam que “o escore x no teste X e o escore y no teste Y estão linearmente relacionados” (Pasquali, 2004. p.266) A partir deste postulado podemos obter a equiparação pela média. Exemplificando, se a média da Forma A for 50 e a da Forma B for 30 terá ou que acrescentar 20na forma B ou retirar 20 da Forma A para equiparar as duas. A equiparação linear, propriamente dita, é indicada quando a diferença entre os escores nas duas formas encontram-se em pontos distintos do teste. Neste caso a equiparação será dada pelos escores padrão e não pelas médias. Quanto ao teste de ancoragem, observa-se que os grupos de equiparação não são equivalentes, portanto a indicação para a equiparação dos escores é a regressão linear. Já a equiparação equipercentilica (percentis) é uma transformação não-linear que compara os percentis dos escores. De acordo com Pasquali (2004) a equiparação via TRI também utiliza de métodos distintos, como a regressão linear, método da média e do sigma, etc. Avalie a questão abaixo e assinale a alternativa correta. Um determinado sujeito foi submetido a duas formas de um teste de inteligência.O resultado percentílico nas duas formas foi igual a 60. Com base nesta informação é correto afirmar que. a) Para que o percentil tenha sido o mesmo foi necessário utilizar o procedimento em espiral neste sujeito b) O resultado equipercentílico indica que os escores brutos também foram os mesmos c) O sujeito pode ter apresentado resultados brutos diferentes, mas ambos correspondentes ao percentil 60. d) Se os resultados brutos foram diferentes foi necessário acrescentar a diferença de valores entre os dois resultados na forma do teste que apresentou escore menor, para equipará-los. e) A equiparação só foi possível porque se utilizou do método das médias. A alternativa correta é a (c). A letra (a) está incorreta porque não é possível aplicar o procedimento em espiral quando se trata de um único sujeito. A letra (b) está incorreta porque os resultados brutos não são necessariamente iguais. As alternativas (d) e (e) também estão erradas porque o método de equiparação é o percentil e não a média.
Compartilhar