Baixe o app para aproveitar ainda mais
Prévia do material em texto
Psicometria – Resumo Geral Introdução à Psicometria o A Psicometria busca medir as propriedades de um construto; Construto: fenômenos psicológicos. o Ela é uma vertente estatística dentro da psicologia que auxilia na criação de instrumentos de medida. Também pode ser definida como o conjunto de técnicas que permitem a quantificação dos fenômenos psicológicos; o Teste psicológico: restritivo aos psicólogos (personalidade, inteligência...) SATEPSI: Sistema de Avaliação de Testes Psicológicos (ele é quem valida os testes). o Avaliação Psicológica: um tripé formado por entrevista (anamnese), observação e testagem Tomada de decisões que impactam a realidade (porte de armas, adoção, etc); Processo mais amplo que engloba diferentes técnicas; Utilizada em diferentes contextos e áreas com diferentes objetivos (trabalho, clínica, trânsito, jurídico) O processo de avaliação é inerente ao processo de compreensão do comportamento humano Encaminhamento, espontânea, compulsória (obrigatória) o O que é QI? Quoeficiente de Inteligência – avalia a capacidade de adaptação em situações específicas; Ele pode ser usado para classificar pessoas, o que não é saudável; Os testes de QI não medem: criatividade, cognição social, habilidades sociais e inteligência emocional; Apenas um nº não é suficiente Quantificação em Psicologia o Medir e mensurar são a mesma coisa; QI = Idade Mental Idade Cronológica Resultado x 100 Rapport o Medir: atribuir símbolos a objetos seguindo regras, sendo que os números atribuídos a esses objetos ou eventos devem representar quantidades de atributos Símbolos: representa o atributo (nº, letra...); Objeto: elemento para o qual a mensuração se dirige (pessoas, animais...); Atributo: característica do objeto aferida pela mensuração (inteligência, por exemplo); Instrumento: meio utilizado para medir o atributo do objeto (testes, questionários...); Regra: formulação do método; Situação-padrão: controle de variáveis que podem interferir no resultado (luz, barulho, saúde...) o Resultado sempre numérico - quantitativo; o Medida relativa (mensuração de algo abstrato) Não existe um ponto zero em comum; Resultados em função de algum quadro de referências; A variável psicológica é definida como uma característica que cada indivíduo possui em diferentes níveis; Pode-se utilizar de dispositivos mecânicos, estímulos físicos ou apenas de uma regra que requer obediência; Nem sempre o instrumento humano é fidedigno (desde o profissional ao sujeito avaliado); É impossível abranger a totalidade de cada um dos fenômenos psicológicos o Função da medida: Um grande problema: usar termos cujos referentes não podem ser adequadamente medidos, dificultando, dessa forma, que as teorias sejam testadas buscar a objetividade; Quantificação: descrição precisa (símbolo mais preciso é o nº); Comunicação: condensa informações, ou seja, é mais precisa e objetiva; Padronização: assegura a equivalência entre objetos com características diversas; Objetividade: permite a classificação com menor ambiguidade. o Tipos de medida: Fundamental e derivada; Fundamental: mensuração direta (coisas extensivas – medir uma mesa com uma régua); Derivada: baseada em indícios que se supõe estarem relacionados com o atributo do objeto medido (coisas intensivas - psicologia); o Dimensões a serem medidas: Atributos: quando são discretas, ou seja, sem grau intermediário (sexo, estado civil... “ou é um ou é outro”); Variáveis: quando são contínuas (peso, altura... possuem valores intermediários); Algumas vezes é preciso utilizar variáveis contínuas como se fossem descontínuas (atributos) por falta de instrumentos adequados para se atingir tal fim Saber sobre faixas e não sobre números exatos (pessoas com alturas entre 1 e 1,2m) o Variáveis: Algo que varia (compreender o motivo da variação); Condição ou característica que é avaliada; Tipos de variáveis: contínuas, discretas, categóricas e ordinais Contínuas (quanti.): possuem um nº infinito (que podem ser fracionados) entre dois valores quaisquer (uma reta real) – não é conveniente na maioria das situações; Discretas (quanti.): possuem um número finito ou contável entre dois valores quaisquer; OBS.: Valores de variáveis contínuas podem ser mensurados em termos discretos (os únicos valores aceitáveis são os anos: 1 anos, 5 meses, 25 dias...) assim como as discretas podem ser usadas como contínuas também (média de 8,9 namorados durante a vida); Categóricas/nominais (quali.): descrevem categorias, características, rótulos... número finito de categorias/grupos/escolhas; Ordinais (quali.): ordem natural/gradação. Exemplo: escala likert, a qual apresenta diferentes gradações para diferentes objetivos. OBS.: uma variável numérica não é necessariamente quantitativa ou representa magnitude o 1=masculino, 2=feminino...; o Faixas etárias: variável qualitativa ordinal. o Escalas de medida Escala nominal Escala ordinal Escala intervalar Escala de razão Muito usadas Pouco usada Nunca usada em Psicologia Aumento da complexidade Escala Nominal: variáveis categóricas/nominais; qualitativa N. º usados apenas como rótulos que identificam e diferenciam as categorias empregadas; Mensuração se dá por meio de categorias; Utilizada para medir atributos; Nível mais simples de mensuração; Regra: membros do mesmo conjunto possuem o mesmo código e membros de conjuntos diferentes possuem códigos diferentes; Postulados de identidade: a igualdade entre os objetos é a base para agrupá-los em uma mesma categoria; Operações matemáticas utilizadas (pouco complexas): contagem/frequência, porcentagem, moda e correlação Escala ordinal: identidade e ordem N. º usados como símbolos identificadores e são ordenados; Fornece o lugar em que cada objeto se encontra com referência a alguma característica avaliada; Objetivo de estabelecer gradações entre fenômenos; Observa a ordem mantida entre as características avaliadas: relações de maior, igual ou menor; Não é necessário que as categorias classificadas estejam igualmente espaçadas na escala; Percentil: fornece a posição relativa dos indivíduos; OBS.: em psicologia, dificilmente se ultrapassa desse nível de medida; Postulados de identidade e ordem: os elementos de um conjunto podem ser organizados em uma série a partir de uma única variável; Operações matemáticas utilizadas: frequência, moda, correlação, mediana, percentil... Escala intervalar: intervalos iguais e significativos Informações numéricas separadas por intervalos iguais; Atribuição de símbolos numéricos que expressam não somente a ordem, como também o tamanho da diferença relativa entre as categorias; As diferenças entres os números podem ser comparadas entre si, as quais representam a diferença entre as características avaliadas; Medida por escores, o que é diferente de percentil (permite dizer que o rendimento de quem está na posição 70 é o dobro do rendimento de quem está na posição 35); A ausência do zero absoluto faz com que se utilize a média como zero arbitrário; Estabelece-se relação entre os intervalos e não entre a quantidade do atributo (os intervalos ou as distâncias que são somados ou subtraídos); Distâncias entre os números significativas; Pode-se aplicar a maioria das operações aritméticas; Escala de razão: maior nível de qualidade informacional Os números contêm dados acerca da relação ou proporção entre as características medidas; Possui um ponto zero fixo, o que permite a comparaçãodos valores escalares; Pode-se dividir um número por outro ou estabelecer uma relação de proporção; Todas as operações de números fundamentais são possíveis, da mesma forma que todas as operações estatísticas; Hierarquia das escalas Psicologia e estatística o Estatística: ferramenta que orienta e sistematiza o planejamento de pesquisas Possibilita a operacionalização de hipóteses (testes de análises estatísticos); Razão Intervalar Ordinal Razão Q u a lid a d e I n fo rm a c io n a l F a c ilid a d e d e U s o Objetivo na psicologia: (1) instrumentalizar para uma boa utilização de manuais de testes psicológicos e aplicação em pesquisa e (2) realizar uma leitura crítica do mundo; o População e amostra População: conjunto de todos os indivíduos de uma determinada classe (com características comuns); N; Amostra: parte/subconjunto de uma população, selecionada com base em algum critério; n. Por que avaliamos amostras e não populações? Dificuldade de operacionalização; Recurso-tempo; Recurso-dinheiro; É selecionada uma amostra representativa: quantidade de pessoas suficiente escolhida de maneira aleatória (aumentar a heterogeneidade) o Estatística descritiva: descrever e resumir dados/resultados As descrições são realizadas por meio de números que expressam e ajudam a entender o significado dos resultados; Variáveis dependentes: é de interesse principal na pesquisa e pode ser influenciada pelas independentes; Variáveis independentes: manipuladas/medidas a fim de verificar se terão alguma influência sobre a dependente; Medidas de tendência central: indicam valores no centro ou no meio de um determinado conjunto de dados (moda, mediana, média); Moda: é a única medida de tendência central que podemos utilizar para representar variáveis do tipo nominal; Média: um dos problemas da média é que ela é sensível aos casos extremos (outliers) Distribuição normal/simétrica: o ponto mais elevado ocorre no meio da distribuição, ou seja, a moda, a média e a mediana são iguais; População Amostra Distribuição anormal/assimétrica: conjunto de dados apresenta uma distribuição assimétrica; Improvável que a média seja representativa da maioria das pontuações, então a moda é utilizada para descrever o resultado típico (Ex.: renda mensal e escolaridade da população); Moda diferente da mediana e da média. Medidas de variabilidade: acompanham as medidas de tendência central Informam-nos o quanto as informações estão distribuídas/espalhadas em torno do centro; Amplitude, desvio padrão e variância; Amplitude: diferença entre a pontuação mais alta e a pontuação mais baixa (pontuações mais extremas) o Não oferece uma ideia global da distribuição. Variância: apresenta uma variação em torno da média aritmética o Quanto menor for a variância, menor a variabilidade em torno da média (o mesmo raciocínio para uma variância maior) Desvio padrão: identifica o erro em torno da média; o Quanto menor o DP, mais constante são os dados (mesmo raciocínio para um DP maior) o Raiz quadrada da variância; Estatística inferencial: processo de extrair informações sobre uma população a partir dos resultados observados numa amostra (representativa) o As informações são sempre acompanhadas de um grau de incerteza ou risco (dedução probabilística); o Parâmetro: medida usada para descrever numericamente uma característica da população (média, DP e proporção); o Conceitos básicos dos testes estatísticos Intervalo e nível de confiança Intervalo de confiança: indica a margem de incerteza e estima o resultado da população expresso em nível de confiança (porcentagem); o É uma probabilidade; o Quanto menor o intervalo de confiança, menor o erro. Nível de confiança: representa a porcentagem de intervalos que iriam incluir o parâmetro populacional se você reunisse amostras da mesma população repetidas vezes (“Estou 90% confiante de que o intervalo entre –a e a contém o verdadeiro valor do parâmetro populacional avaliado”). P-valor Probabilidade de a diferença entre os grupos ter ocorrido ao acaso; Quanto menor o valor de P, mais significante (maior) é a diferença entre os grupos (≤ 0,05) Grupos pareados: mesmo grupo (ou muito semelhante) em tempos diferentes Medidas repetidas e emparelhadas, média das diferenças. Grupos não pareados: grupos totalmente diferentes Medidas independentes, diferença das médias dos grupos. Testes paramétricos: usados para distribuições normais (ou próximas); medida Variância assumida: homogênea; Variáveis: intervalar e de razão; Relação entre os dados: independentes; Medida de localização central: média. Testes não paramétricos: usados para distribuições não normais; ordem resultado ou medida Variância: qualquer uma; Variáveis: ordinal ou nominal; Relação entre dados: independente ou pareada; Medida de localização central usada: mediana. Diferença entre grupos As diferenças entre eles são significativamente grandes do ponto de vista estatístico? Qual a chance de serem reais (e não terem ocorrido ao acaso)? Teste T de Student: distribuição normal e amostras independentes/diferentes Verifica se a diferença é significativa. Teste T Pareado: distribuição normal e amostras iguais Compara a variação de um construto antes e depois de um fato. ANOVA: mais de dois grupos/médias Verifica se a diferença é significativa Correlação: não é causalidade o Cálculo estatístico que avalia a relação entre duas ou maus variáveis; o Coeficiente de correlação: índice que expressa o grau de associação entre duas variáveis Na psicometria: Construção de testes psicológicos; Análise de itens; Validade; Fidedignidade. o Quanto maior a relação maior a correlação; o Positiva ou negativa Se duas variáveis aumentam ou diminuem de forma simultânea, então se diz que ambas são positivamente correlacionadas; Quando uma variável aumenta e outra diminui, elas estão negativamente correlacionadas; Correlação = 0: não existe nenhuma correlação entre as variáveis o Gráfico de dispersão: são pontinhos que expressão a relação entre X e Y Fornecem uma indicação rápida da direção e magnitude da relação (se houver); Linha de melhor ajuste: representa todos os pontos do gráfico da melhor maneira possível; Os pontos devem estar próximos à linha para indicar que há correlação positiva. Análise Fatorial: resumir a informação contida em diversas variáveis o Condensar em um novo conjunto de novas dimensões (fatores), com perda mínima de informação; o Fator: cada grupo de frases (itens) de um teste que se correlaciona pode ser chamado de fator; o Objetivo: determinar quantos fatores existem e quais frases (itens) se correlacionam com quais fatores; o Carga fatorial: relação item-fator que é quantificada com um número que varia de -1 a +1; o Precisão: é indicada pela relação entre os itens; se todos os itens estiverem medindo a mesma coisa de maneira semelhante, então esse instrumento é preciso; Introdução aos testes psicológicos: características e aplicabilidade o O que são testes psicológicos? Instrumento padronizado; Busca oferecer amostras do comportamento ou de funções cognitivas; Objetivo de descrever e/ou mensurar processo psicológicos (emoção, cognição, motivação, memória...); Especificidades O psicólogo precisa estar capacitado o O instrumento escolhido deve ter qualidade técnica e científica reconhecida; o O profissional deve ser capaz de avaliar o resultado no contexto processual da avaliação psicológica; o Formação continuada após a graduação. Preservar as informações doteste, pois são informações sigilosas o Acesso indevido malefícios; o Não deve ser divulgado em nenhum meio de compartilhamento Características técnicas necessárias o Precisão (confiabilidade ou fidedignidade); o Validade; o Padronização; o Normatização; o Manuais (SATEPSI) – fundamentação teórica, evidências de fidedignidade e validade e sistema interpretativo. Classificação dos testes o Psicométricos: busca mensurar, através de critérios objetivos (concretos e observáveis), o que está sendo avaliado Uso obrigatório da estatística: descritiva/inferencial; Padronização das tarefas (aplicação e interpretação): respostas fechadas, permite avaliação coletiva, programas informatizados para interpretação; Preferência por respostas de escolha forçada: escala likert; maior confiabilidade; Construtos com base em diferentes teorias; Ênfase no instrumento: aplicação e interpretação altamente padronizadas OBS.: nem sempre isso acontece, uma vez que a avaliação qualitativa também é muito importante. Escalas Wechsler de Inteligência para Adultos (WAIS - III); Escalas Wechsler de Inteligência para Crianças (WAIS - IV); Bateria Fatorial de Personalidade (BFP); Escalas Beck. o Projetivos: critérios para interpretar e/ou caracterizar determinado construto são subjetivos (dinâmicos e não observáveis) envolvendo tarefas pouco estruturadas Apuração das respostas e interpretação sujeitas à subjetividade do avaliador; Menor ênfase nos dados normativos: ênfase no contexto específico do sujeito, que inclui o contexto de vida e da avaliação; Estímulos vagos e ambíguos com margem para interpretação: eficiente para quebrar o gelo, tarefas interessantes e agradáveis, menor reação defensiva; Maior riqueza de informações: pode revelar aspectos inconscientes, ocultos e latentes da personalidade; Ênfase no avaliador: interpretação subjetiva que nem sempre é coerente com a realidade; O profissional precisa de muito treinamento para não influenciar nas respostas do sujeito avaliando; H-T-P: Casa-Árvore-Pessoa; Método de Rorschach – Sistema Compreensivo de Exner o Formas de aplicação Individual, coletiva, lápis e papel, informatizada. o Instrumentos psicológicos computadorizados Prós: Prático, econômico e confiável; Gera estímulos mais complexos e variáveis específicas; Examinador livre para avaliar qualitativamente o comportamento do sujeito durante a execução da tarefa. Contras: Dificuldade de acesso a computador e internet; Não familiaridade do avaliador com a tecnologia; Falta de auxílio do avaliador em relação a dificuldades do avaliando. Contextos de uso Psico. clínica, hospitalar, escolar, neuropsicologia, psico. do esporte, forense... Validade o A definição do termo foi mudando ao longo da história; o Definição mais clássica: O alcance em que o teste mensura o que se propões medir ou ao conhecimento do que o teste mede e de quão bem ele faz isso (Anastasi & Urbina, 1997); o Caso o teste não apresentar evidências de validade fortes, sua utilização em práticas profissionais é ética e tecnicamente impedida sem segurança nas interpretações Pesquisadores; Comitê de juízes do SATEPSI. o Tipos de validade: Santíssima trindade da Validade (Psicologia Clássica) Não é utilizada mais; Faz parte do processo histórico da validade e, hoje em dia, está atualizada; Validade de conteúdo, de critério e de construto. o Messick (1986): questionou e aprimorou a definição de validade conceito único Uso de um teste/instrumento: O que eu quero saber, medir, avaliar? Qual é a demanda/queixa específica? A demanda é de uma pessoa ou grupo? Em qual contexto/situação? Quais instrumentos posso usar? Quais são as propriedades psicométricas dos testes? Reformulou o conceito de validade de construto, reconhecendo como sinônimo de validade (“validade de validade”); Conceito abrangente que inclui sob si todas as outras formas de validade; o Tipos de validade Fontes de Evidência de validade (são 5) O que vigora atualmente; Uma coisa só; Cada evidência específica busca aspectos de um ponto conceitualmente único sobre como interpretar os escores de um teste (diferentes caminhos e fontes). o Perguntas centrais Quais evidências suportam/apoiam a interpretação ou o sentido dos escores (validade de construto)?; Base evidencial: Quais evidências suportam a relevância dos escores para o propósito aplicado (validade de construto + relevância/utilidade)? Relevância e utilidade do teste em um contexto aplicado. Base consequencial: Quais razões fundamentais tornam credíveis as implicações de valor das interpretações dos escores e qualquer uma das implicações para ação ou tomada de decisão associadas a estas interpretações (validade de construto + implicações de valor)? Decorrências potenciais e/ou reais intencionais e não intencionais do uso dos testes. Base consequencial: Quais evidências e argumentos irão indicar o valor funcional em termos de usos intencionais e consequências não intencionais das interpretações do teste (validade de construto + relevância/utilidade+ implicações de valor + consequências sociais)? o Conceito final de validade de acordo com as ideias de Messick: “Grau em que evidência (científica) e teoria sustentam as interpretações dos escores (resultados) dos testes vinculados aos usos propostos dos testes”; o Como verificar a validade? 5 fontes são utilizadas para evidenciá-la: Base no conteúdo (interno ao teste): analisa se os itens são representativos do construto que se deseja medir o Abarca todas as facetas e nuances em um nº de itens suficiente; o Os pesquisadores desenvolvem definições operacionais e constitutivas detalhadas que especificam o conteúdo a ser abarcado no instrumento TEORIA Comprovar na Construir itens o Avaliação qualitativa: comitê de especialistas em psicometria e no construto avaliado; o Avaliação quantitativa: cálculos feitos a partir da análise qualitativa (IVC – Índice de Validade de Contúdo) que indicam a porcentagem de concordância entre os avaliadores; Base na resposta (interno ao teste): levantar dados sobre os processos mentais envolvidos no processo de respostas (ou comportamento) o Métodos qualitativos: Questionamento dos respondentes sobres suas estratégias de resolução; Uso de observadores que registram os dados a fim de verificar se há concordância. Estrutura interna (interno ao teste): “tirar a prova” o Correlação entre os itens do teste e/ou seus componentes ou subtestes; o Provar a coerência do teste com a teoria ou encontrar o que a teoria não percebeu de maneira empírica testa se o teste vai captar o que está na teoria; o Alpha de Cronbach: correlação média entre as respostas Indica algo sobre a consistência interna do teste; Quando maior o α e a consistência interna, mais coerente é o teste em relação a teoria capa de medir o que pretende. Relações com variáveis externas (externo ao teste) o A validade externa do teste mostra a sua relevância na sociedade; o Dados sobre os padrões de correlação entre os escores do teste e outras variáveis medindo construto ou construtos relacionados (convergência) e com variáveis medindo construtos diferentes (divergência); o Investigam-se as relações dos índices obtidos no teste com variáveis externas relevantes; o Variáveis: Critério: observação de eventos comportamentais relevantes por si só; Decidido pelo pesquisador; Fundamentação teórico-empírica: revisão da literatura (teoria de base de determinadoconstruto); Avaliação da VC feita simultaneamente ao teste: validade diagnóstica o Associações altas: atingiu-se conhecimento da situação presente. Avaliação da VC feita após o teste: validade preditiva; Por exemplo: Teste de matemática e o desenvolvimento escolar (o desenvolvimento escolar seria um critério externo ao teste). Outros testes: similares, relacionados ou diferentes (teorias diferentes) Validade convergente: avaliação feita entre testes similares/relacionados, então espera-se uma correlação alta ou moderada (quando se mede construtos relacionados); Validade divergente: avaliação feita entre testes que medem construtos diferentes, então espera-se uma correlação próxima a zero; Teste que medem construtos diferentes correlacionando: tem algo de errado (com o novo teste)! Comparação feita com testes padrão ouro; Consequências da testagem (esterno ao teste): ética o Consequências sociais intencionais ou não; o Conferir se está surtindo o efeito desejado (contexto aplicado); o Benefícios e malefícios; o É uma questão ética vincular ao teste as consequências Variáveis critério; Medindo os mesmos construtos; Medindo construtos relacionados; Medindo construtos diferentes O profissional psicólogo: papel central para a validade consequencial; Outros profissionais: a falta de entendimento pode gerar interpretações enviesadas ou injustas; Sujeitos avaliados: papel de fiscalizador; CFP: elaboração de cartilhas e comunicados à comunidade, a fim de recomendar a realização adequada de um processo de AP. Fidedignidade o Palavras-chave: precisão, confiabilidade e estabilidade; o Objetiva diferenciar os testandos em níveis (baixo, médio ou alto); o É um critério de qualidade de um teste; o Não é uma propriedade fixa de um teste: o mesmo instrumento pode não ser considerado confiável segundo diferentes condições; o A confiabilidade pode ser afetada dependendo do método estatístico utilizado para avalia-la; o Conceitos: Estabilidade (ao longo do tempo) dos resultados que as pessoas testadas obtiveram em aplicações diferentes de um mesmo teste/ aplicações similares de testes distintos; “Quão bem o conjunto de itens do teste consegue produzir escores que diferenciam testandos com diferentes graus de habilidade, personalidade, entre outros” Grau de flutuação esperado dos escores em aplicações subsequentes Escores similares: + fidedignidade (quando mais, melhor); Escores diferentes: -fidedignidade (quanto menos, pior). o Teste com baixa fidedignidade não será validado, pois não mede apropriadamente o construto de interesse Na prática, sempre se começa pela propriedade mais fácil e barata, ou seja, primeiro testa a fidedignidade e, caso tenha sucesso, a validade em seguida; Validade + fidedignidade são necessárias de maneira conjunta, ou seja, sem uma não tem a outra; o Teste-reteste O mais clássico: avalia a estabilidade dos escores do teste ao longo do tempo Correlação dos escores dos mesmos testandos avaliados em momentos diferentes; Erro avaliado: estabilidade dos resultados em mais de uma aplicação; Coeficiente de estabilidade ou constância; Correlação alta: > 0,80 O período entre as aplicações é importante: É aconselhável que os testes não sejam aplicados em períodos curtos suficiente para que os testando se lembrem das respostas e nem longos suficiente para que mudanças (desenvolvimento e aprendizagem) ocorram e alterem o resultado do 2º teste; Eventos positivos e negativos da vida também influenciam no resultado; o Fidedignidade de formas alternadas (ou paralelas) Coeficiente de equivalência e consistência interna; Erro avaliado: conteúdos itens; Não é usado pela inviabilidade de criar dois testes diferentes; Avaliar a relação entre os escores dos testandos em duas versões de um mesmo teste em um período de tempo Problemas de aplicação: o Caso seja feita no mesmo dia: conteúdo; o Caso seja feita em dias diferentes: tempo. A 2ª versão do teste deve ter: o Mesmo nº de itens; o Mesmo formato; o Mesma dificuldade/atratividade; o Mesmas instruções. Espera-se uma alta correlação e que as versões sejam semelhantes Avaliação da personalidade Pode ser avaliada por traços: características relativamente duradouras; Mas também por estados: características temporárias; Dias diferentes Estados diferentes Resultados diferentes. o Avaliação de fidedignidade de um teste aplicado apenas uma vez Duas metades (duas partes/Split half) – não é tão usado Consistência interna do teste; Valor da correlação: 0,80 Para achar a % de validade: 0,802 Resultado: 64% de variância Erro: 36% Erro avaliado: conteúdo dos itens; Não é dividido necessariamente na ordem crescente das questões; Separar o teste em duas partes e calcular a correlação entre elas; o Alta correlação = fidedignidade no teste todo Problema: determinar como o teste deve ser dividido, uma vez que coeficientes distintos podem ser obtidos dependendo da forma como o teste é dividido; Alfa de Cronbach – α Consistência interna do teste; Erro avaliado: homogeneidade do grupo de itens; Média de todos os coeficientes possíveis de duas metades de um teste e indica o valor esperado de uma divisão aleatória do conjunto de itens do teste; De 0 a 1: quanto mais próximo de 1, mais fidedigno Testes politômicos (escalas Likert) e testes ditômicos (sim ou não – coeficiente Kuder-Richardson). Fidedignidade do avaliador Testes projetivos (subjetividade do avaliador); Coeficiente de concordância; Erro avaliado: subjetividade do avaliador; Evidências adicionais de fidedignidade são necessárias Correlação dos resultados das correlações de 2 avaliadores diferentes (similaridade) Complementa evidências, como as anteriores. Limitações dos métodos clássicos de avaliação da fidedignidade Avaliam o teste de maneira geral: esses índices consideram que o erro é constante para todo o continuum de construtos avaliados; α > 0,90 = excelente; 0,89 > α > 0,80 = bom; 0,79 > α > 0,70 = aceitável; 0,69 > α > 0,6 = questionável; 0,59 > α > 0,5 = ruim; α < 0,50 = inaceitável. Não sabemos qual a quantia de erros para testandos que pontuam baixo, médio ou alto no teste (além das diferentes fontes de erro) Como saber se a discriminalidade dos indivíduos é adequada? Saber em qual parte do construto há mais erro é fundamental. TRI – Teoria de Resposta ao Item: permite avaliar especificamente em que parte do construto o teste está mensurando mais adequadamente os participantes e onde há mais erros de medida. Não faz parte da teoria clássica da psicometria; Erro avaliado: discriminação e dificuldade, além da localização dos erros. Texto 7 - Padronização e normatização de testes psicológicos: simplificando conceitos As informações de padronização e normatização ficam no manual do teste INTRODUÇÃO O que diferencia os testes psicológicos de outras técnicas de avaliação? o Procedimentos referenciados a normas e diretrizes interpretativas padronizadas, com base em categorias preestabelecidas. Avaliação psicológica: três critérios o A medida, o instrumento e o processo de avaliação. Foco do texto: teste psicológico considerando-o como um instrumento de mensuração padronizado que avalia características ou processos psicológicos fundamentados em uma teoria e que atende aos requisitos de validade e precisão. Padronização: “refere-se” à necessária existência de uniformidade tanto para a aplicação do instrumento, como nos critérios para interpretação do instrumento, como nos critérios parainterpretação dos resultados obtidos. PADRONIZAÇÃO E NORMATIZAÇÃO: CONCEITOS IGUAIS OU DISTINTOS? Padronização: a uniformidade na aplicação dos testes (material, ambiente, aplicador, instruções de aplicação e correção, etc.). Normatização: a uniformidade na interpretação dos escores dos testes (tabelas, percentis, escore z, etc.). o Conceitos de Cronbach, Alchieri & Cruz e Pasquali Apesar de observar-se a diferença entre padronização e normatização, não há uma diferenciação dos termos. PADRONIZAÇÃO Uniformidade dos procedimentos no uso de um teste válido e preciso. PRECAUÇÕES QUE DEVEM SER TOMADAS NA APLICAÇÃO DOS TESTES: PADRONIZANDO AS CONDIÇÕES DE ADMINISTRAÇÃI DOS TESTES PSICOLÓGICOS A padronização das condições de aplicação faz com que a coleta de dados sobre o sujeito seja de boa qualidade o Não é apenas uma boa ferramenta que garante um teste de boa qualidade. OBS.: Uma má aplicação não invalida a qualidade psicométrica do teste, mas, sim, invalida o protocolo do sujeito, ou seja, os dados obtidos na avaliação não serão confiáveis. o Por isso a padronização é importante: pretende garantir o uso adequado e autêntico dos testes psicológicos. O MATERIAL DE TESTAGEM Qualidade do teste: ele deve ser válido e preciso. Caso o uso do teste seja feito sem o cumprimento destes parâmetros, corre-se o risco de processos jurídicos e condenação ética, tornando-os inúteis. Pertinência do teste: ele deve ser relevante ao problema apresentado pelo sujeito. O aplicador deve conhecer a utilidade do teste e escolher aquele que melhor se aplica à necessidade do sujeito. O teste também deve adaptar-se ao nível (intelectual, profissional, etc.) do candidato. É importante seguir as instruções e recomendações que estão presentes no manual, mas não devemos assumir uma postura estereotipada e rígida o Primeira tentativa: explicar seguindo à risca o material; o Segunda tentativa: tentar explicar o teste com as próprias palavras, mas sem dar dicas sobre ele; o Caso a dúvida persista, não aplicar o teste (dado cognitivo muito importante para o relatório final). O AMBIENTE DO TESTE Ambiente físico: o Deve proporcionar ao candidato a sensação de estar em suas melhores condições para responder ao teste; o Eliminar distratores ambientais; o Móveis adequados, iluminação apropriada, ventilação, higiene, ausência de barulho. Condições psicológicas: o Observar se o sujeito apresenta-se em condições normais de saúde física e psicológica; o Certificar que o sujeito compreendeu o que deve ser feito no teste (seguindo as instruções do manual para explicar); o Estabelecer o rapport: assumir uma atitude que faça o sujeito sentir-se à vontade ao fazer o teste, implicando o examinador mostrar-se motivador e encorajador. O momento: o De acordo com os ambientes físico e psicológico, será avaliado quanto tempo deverá durar a aplicação dos testes psicológicos; o Teste muito extenso: dividi-lo em mais de uma sessão para evitar fadiga; Situações adversas: aplicação de testes para fins periciais e a testagem para seleção. CONDIÇÕES DE APLICAÇÃO Condições desfavoráveis para administração de testes psicológicos podem causar efeitos no desempenho deles. Os resultados nos testes são afetados pelos procedimentos utilizados durante a administração dos instrumentos. É importante controlar fatores, como: o O tempo suficiente para o examinando responder e o examinador fazer as observações necessárias para emitir seu julgamento; o O nível de dificuldade das palavras e a maneira de apresentar as instruções; o Fatores que podem distrair a atenção do examinador. O APLICADOR Muito importante principalmente na testagem individual; O modo de ser e atuar pode afetar bastante os resultados do teste; Requisitos que devem ser cumpridos: o Conhecimento: deve conhecer o instrumento a ser usado, a fim de sanar possíveis dúvidas e analisar fidedignamente; o Aparência: causar boa impressão e evitar exageros (perfumes, por exemplo); o Comportamento durante a testagem: conduzir a testagem, mantendo a ordem, o respeito e a orientação; o Gravação de sessões: somente com o consentimento do examinando. o Necessário prevalecer o princípio da isonomia, que consiste em tratar todos do mesmo modo, com condições de avalição iguais. o Preparo prévio do aplicador: durante os testes, não pode haver emergências, o que é a única forma de garantir a uniformidade de procedimento. LEIS E TESTES PSICOLÓGICOS Normas da Constituição dos países e da Nações Unidas; O psicólogo responde por sua conduta nessa área de testes. A lei considera o psicólogo como perito e, portanto, legalmente responsável em sua atuação profissional. Código de Nuremberg (1949): toda experimentação com seres humanos requer prévio consentimento livre e esclarecido do sujeito participante; Declaração de Helsinque: consentimento + bem-estar do sujeito como prioritário; Normas para a testagem educacional e psicológica da American Psychological Association (APA). SIGILO E DIVULGAÇÃO DOS RESULTADOS Seguir as normas do sigilo profissional contidas no Código de Ética do Psicólogo no Brasil (CFP, 1987). o O que é vedado ao psicólogo e quais são os seus deveres. A pessoa que se submete ao teste tem o direito de receber informações sobre os resultados da testagem, assim como o solicitante da avaliação. É preciso seguir as normas de sigilo entre profissional e paciente o Arquivos em locais seguros; o Identidades codificadas de tal forma que somente o profissional responsável seja capaz de identifica-las; o Em processos judiciais, o juiz pode solicitar a abertura de registros sigilosos. NORMATIZAÇÃO A normatização pressupõe que um teste necessita ser contextualizado para poder ser interpretado. Tal conceito diz respeito a padrões de como se deve interpretar um resultado que a pessoa atingiu em um teste. Os resultados brutos não são muito úteis: números que não transmitem nenhum sentido. Assim, por meio da estatística descritiva, pode-se relacionar ou dar sentido aos dados de modo a facilitar a sua compreensão e utilização. o Qualquer resultado bruto deve ser referido a alguma norma ou a algum padrão para que tenha algum sentido; o A norma permite posicionar o resultado de um sujeito, possibilitando fazer inferências sobre ele; o Possíveis inferências a partir da norma: A posição em que a pessoa se localiza no traço medido pelo teste que produziu o resultado medido; A comparação da pontuação deste sujeito com os resultados de outras pessoas com características similares. Processo de criação de normas: o Um teste deve ser aplicado a uma amostra representativa do tipo de pessoa para o qual foi planejado – amostra de padronização; o O gruo possibilita a composição de tabelas que serão estabelecidas como normas, indicando não somente as médias, mas também os diferentes graus de desvios, acima ou abaixo da média; o Pasquali (2001) diz que a norma de interpretação é normalmente definida pelas normas de desenvolvimento e pelas normas intragrupo. NORMAS DE DESENVOLVIMENTO Nível de desenvolvimento do indivíduo humano (observado mais a fundo pela pediatria); Normas fundamentadas que podem ser expressas no desenvolvimento progressivo de aspectos psicológicos, tais como maturação psicomotora, maturação psíquica, idade mental, série escolar, entre outras. o Informam sobre o que o indivíduo passa ao longo de sua vida Idade mental o Conceito introduzido por Binet e Simon na revisão de 1908 das escalas de Binet- Simon; o Os itens individuais são agrupados em níveis de idade. Assim, espera-se que o resultado de uma criança no teste corresponda ao nível mais alto dentro de sua idade; o QI = Quociente Intelectual; IM = Idade Mental; IC = Idade Cronológica;o Se um sujeito responde a todas as questões relacionadas ao seu nível de idade cronológica, representará um QI de 100. 𝑄𝐼 = 100 𝑥 𝐼𝑀 𝐼𝐶 Normas educacionais – Série escolar o Empregado para testes de desempenho acadêmico e pode ser utilizado quando se trata de disciplinas que são oferecidas numa sequência de várias séries escolares; o As normas são construídas por meio da pontuação bruta média obtida por alunos em cada série, resultando numa pontuação bruta média obtida por alunos em cada série, resultando numa pontuação típica para cada série; o 1ª série – percentil 1; 2ª série – percentil 2... Estágio de desenvolvimento o Utilizadas por profissionais da psicologia infantil que estudam os desenvolvimentos mental e psicomotor em termos de idades consecutivas de desenvolvimento, Gesell e Piaget. NORMAS INTRAGRUPO Critério de referências dos resultados: população ou o grupo para o qual o teste foi desenvolvido; A pontuação que o sujeito apresentou em um teste toma sentido em relação aos resultados dos demais sujeitos da população. PERCENTIS Indica a posição relativa do sujeito na amostra de padronização; Quanto maior, melhor o desempenho; Diferente de porcentagem; A localização do sujeito, do ponto de vista percentílico, indica quanto por cento de pessoas desta população (amostra) apresentaram resultados inferiores ao dele o Exemplo: um percentil de cinquenta indica que o sujeito se situa na mediana dos escores da mostra. Dificuldade: as distâncias entre escores percentílicos sucessivos não são constantes, mas variam segundo a posição do escore no início/fim da escala ou no meio dela. Não devem ser confundidos com “resultados de porcentagem”. São úteis também para comparar a realização do indivíduo em diferentes testes. Vantagens do uso: o Universalidade para interpretação e comparação de resultados; o Adequado para tipos de testes variados; Desvantagem: o Distribuição dos sujeitos na amostra: são concentradas grandes quantidades de sujeitos na mediana/centro, enquanto os extremos são muito comprimidos. ESCORE PADRÃO Resultados padrão; escore Z; De -5 a +5; Revela a distância do sujeito em relação à média, em termos de desvio padrão da distribuição; Relacionado ao resultado bruto do sujeito; Escore padrão linear: o Relação entre o desvio do escore bruto em comparação à média e ao desvio padrão dos escores do mesmo grupo 𝑍 = 𝑋 − 𝑀 𝐷𝑃 X = escore bruto M = média DP = desvio padrão o Pode ser expresso em uma escala padrão sem afetar a posição relativa dos indivíduos no grupo nem mudar a forma da distribuição original; o Expressão os escores brutos de formas paralelas de um mesmo teste, sobretudo se as formas possuem dificuldades diferentes; o Facilitam a comparação e a interpretação dos resultados. ESCORE PADRÃO NORMALIZADO (EPN) Presentes em uma distribuição que foi transformada a fim de se adequar a uma curva normal; Escores padrão forçados a apresentar uma distribuição normal pela conversão dos equivalentes percentis dos escores brutos em correspondentes escores padrão ao longo da cursa normal, independentemente da forma original da distribuição; Geralmente apresentam média cinquenta e desvio padrão dez. TRANSFORMAÇÕES DO ESCORE PADRÃO Presença de casas decimais e valores negativos: costuma-se empregar outra transformação linear visando a deixar o escore padrão em um formato mais conveniente; Normalmente o Z é multiplicado por um coeficiente e ao produto é agregado uma constante; Algumas transformações utilizadas universalmente: Escore T = 50 + 10z QI de Desvio = 100 + 15z (Escalas de Wechsler) ou QI de Desvio = 100 + 16z (Stanford-Binet) CEEB = 500 = 100z Outra muito conhecida: escala de padrão nove; classes normalizadas ou estamino (Força Aérea do EUA – 2ª Guerra Mundial) o Os resultados vão de 1 a 9 Realizar a transformação a resultados de apenas um dígito facilita a realização de cálculos, sobretudo com máquinas.
Compartilhar