Buscar

Psicometria estudos B1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

B1
Ok 1 Pasquali. Psicometria. P. 12-22
(origem da psicomentria) (livro branco)
Ok 2 Hutz. Psicometria. Cap. 1
(avaliação psicológica)
Ok 3 Pasquali. Instrumentação psicológica. P. 56-78
(teoria da medida) (livro rosa)
Ok 4 Urbina. Fundamentos da testagem psicológica. P. 43-120
(estatística)
Ok 5 Pasquali. Psicometria. P. 79-107
(o modelo da psicometria moderna) (livro branco)
1 PASQUALI, L. Psicometria: teoria dos testes na Psicologia e na Educação. 4. ed. Petrópolis: Vozes, 
(cap. 1, p. 12-22)
ORIGEM E HISTÓRICO DA PSICOMENTRIA
Origem (história da avaliação psicológica): responder ao problema de como avaliar aptidões humanas.
Surge no campo das aptidões humanas (mentais, físicas e psicofísicas) por ser temática da época (sec XX) e coadunava a um estudo quantitativo passível de contabilizar acertos e erros do comportamentos humano.
1 Orientação empirista: processos comportamentais/sensoriais (Galton, Spearman etc.)
Trabalhos estatísticos de Spearman que seguiu os procedimentos fisicalistas de Galton.
2 Orientação mentalista (Binet, França): processos mentais (Binet e Simon)
Ex.: teste de inteligência de Binet: orientação puramente descritiva dos processos psicológicos, faltava-lhe o enfoque quantitativista próprio dos empiristas
Não deu origem à Psicometria.
Duas origens independentes (preocupações prática e teórica da Psicomentria), mas que se unificam na Psicometria Clássica.
1 prática – psicologia individual (preocupada com problemas humanos): caráter psicopedagógico e clínico: para detectar retardo mental e potencial acadêmico (Catell e outros psicometristas americanos)
2 teórica – psicologia experimental (preocupada com a ciência pura): desenvolvimento da teoria psicométrica (psicólogos de orientação estatística) (Pearson e Spearman)
Unificação em 1940 mediante atuação dos psicólogos que utilizavam análise fatorial. (Thurstone)
História da Psicometria esquematizada em termos de era/décadas
1 era de Galton (1880): avaliação das aptidões humanas através da medida sensorial (Inquires into Human Faculty - 1883)
Propõem para além das avaliações: questionários e entrevistas aliando medidas quali e quanti.
2 era de Catell (1890): influenciado por Galton, desenvolve medidas das diferenças individuais (Mental tests and measurements - 1890). Inaugura o termo "teste mental".
- discípulo de Galton: continua com medidas sensoriais fazendo correlação com medidas de desempenho acadêmico
- quanto menor o tempo de reação a um determinado estímulo, maior seria o desempenho acadêmico do sujeito.
- tinha ideia certa, mas sem instrumento adequados em 1890 para medir
- medidas por meio dos órgãos do sentido associadas com o desempenho acadêmico do sujeito
3 era de Binet (1900): avaliação das aptidões humanas visando a predição na área acadêmica e na área da saúde. 
Nesse período também se destaca a era de Spearman (Inglaterra): lança os fundamentos da Psicometria Clássica (The proof an measurement af association between two things - 1904; General inteligence...1904; Demonstration of formulae...1907; Correlation of...1913)
- um dos mais famosos: avaliação do QI das crianças
- convidado pela secretaria de saúde/educação de Paris para avaliar crianças
(contexto: inclusão de criança nas escolas, necessário classificar)
- avaliar aptidão e inteligência (até então eram instrumentos sensoriais ou acadêmicos)
- propõe itens para avaliação de conhecimento a partir de processos envolvidos na inteligência
- alia-se a Simon: constroem escala
- validade: o que de fato meu teste mede (se propõe a avaliar inteligência e avalia)
- separa crianças normais das demais
- escala de QI funcionava muito bem até os 16 anos, quando então se atinge um platô (mesmo nível de desenvolvimento). Obs: se continuo com o mesmo nível de desenvolvimento de QI e minha idade vai aumentando, quer dizer que vou emburrecendo? Não, assim foi feita nova escalonagem.
O instrumento proporciona informação numérica e para cada instrumento haverá uma interpretação.
4 era dos testes da inteligência (1910-1930): teste da inteligência Binet-Simon (1905), artigo Fator G de Spearman (1904), revisão do teste de Binet par aos EUA e impacto da 1ª Guerra Mudnial com necessidade de seleção rápida, eficiente e universal de recrutas para o exército (testes Army Alpha e Beta).
- boom de testes
- Primeira Guerra mundial
- Spearman: utilização de estatísticas para comprovar a eficácia de instrumentos
5 era da análise fatorial (1930): 1920 evidencia que os testes de inteligência eram dependentes da cultura onde foram criados, não apoiados num fator geral universal como proposto por Spearman. Psicólogos estatísticos começaram a repensar as ideias de Spearman. Kelley (1928), seguido por Thomson (1939) e Burt (1941) na Inglaterra e Thurstone (1935, 1947) nos EUA que desenvolve a análise fatorial múltipla e atua no desenvolvimento da escalonagem psicológica. Em 1936 funda a Sociedade Psicométrica Americana e a revista Psychometrika.
- análise estatística
- teoria clássica
- faz agrupamento dos itens: quais itens tem maior relação do que outros (afinidade, associação) para se identificar o que se deseja medir
- números que comprovem a informação obtida por meio de análise fatorial e outros recursos estatísticos.
6 era da sistematização (1940-1980): trabalhos de sínteses (Guilford 1936 sistematizar avanços da Psicometria; Gulliesen 1950 teoria clássica dos testes psicológicos; Torgerson 1958 teoria sobre a medida escalar)... (ver mais detalhes p. 16-17) e crítica (Stevens 1946 crítica às escalas de medidas; Lord e Novick 1968 crítica à teoria clássica dos testes apresentando teoria alternativa, a teoria do traço latente, que se desenvolve na teoria moderna da Psicometria: a teoria de resposta ao item - TRI; Sternberg 1877-1985 superar as dificuldades clásssicas da Psicometria com seu modelo, procedimentos e pesquisas sobre os componentes cognitivos na área da inteligência.)
- tudo o que foi feito nas eras anteriores
- surge teoria de “resposta ao item” (TRI) (percebendo limitações do uso de estatísticas clássicas que verificavam desempenho formal do sujeito, necessidade de verificar itens.) (pq sujeito com habilidade alta errava item muito fácil ou sujeito com habilidade básica acerta item muito difícil?) aqui entra a estatística moderna para compreender as características de cada item, parâmetros específicos para cada item.
7 era da Psicometria moderna (1980): TRI. Não resolveu os problemas fundamentais para se tornar o modelo moderno definitivo de Psicometria e não veio substituir a Psicometria Clássica, apenas partes dela. Ainda assim, é o que há de mais novo no campo.
Linhas nas quais os Psicometristas veem atuando:
1 Sistematização Psicométrica Clássica
2 Pesquisa na TRI
3 Pesquisa em áreas paralelas da Psicometria
- testes com referência a critério
- testes sob medida (CAT)
- banco de itens
- equiparação dos escores
- validade dos testes
- vieses dos testes e funcionamento diferencial dos itens
- construção de itens
4 Impacto dos trabalhos de PSI Cognitiva com pesquisas na área de aptidões por meio do estudo de componentes cognitivos
5 Revistas com trabalhos publicados
Testes psicológicos
Surgem no final do sec XIX e primeiras décadas do sec. XX.
Campo onde a Psicometria se origina e mais se desenvolve.
Trabalhos de Galton (1822-1911) em seu laboratório em Kensington, Inglaterra.
Duas preocupações na área de avaliação psicológica:
1 preocupação psicopedagógica e psiquiátrica na França. (Esquirol, Srguin, Binet): retardo mental, linguagem
2 preocupação experimentalista (Ale, Ingl, EUA): descoberta de uniformidades no comportamento dos indivíduos, não tanto as diferenças individuais (como na escola francesa). Diferenças eram vistas como desvios ou erros. Comportamento sensorial. Preocupação com o controle das condições em que se faziam as observações.
Teóricos (p. 19-21)
1 Galton
2 Catell
3 Binet e Henri
Os testes individuais se popularizam com a 1ª Guerra Mundial,surgindo também testes coletivos. 
Industria e instituições fazem uso massivos desses testes, sobretudo no campo das aptidões.
Thurstone: com a análise fatorial de sua baterial Primary Mental Abilities incentiva o aparecimento de outras baterias (DAT, GATB, TEA, WISC, WAIS). 
A área da personalidade também desenvolve centenas de testes e inventários de personalidade (MMPI, 16PF, EPPS, POI, CPI, CEP, EPI), além de instrumentais menos objetivos como os testes projetivos (TAT, CAT, Rosenzwein, Szondi, Rorschach, HTP).
Instalada a tecnocracia dos testes e da Psicometria.
2 HUTZ, C. S. O que é avaliação psicológica: método, técnicas e testes. In: ______; BANDEIRA, D. R.; TRENTINI, C. M. (Org.). Psicometria. Porto Alegre: Artmed, 2015. (Coleção Avaliação Psicológica) 
(cap. 1, p. 11-21)
AVALIAÇÃO PSICOLÓGICA
AVALIAÇÃO PSICOLÓGICA ou PSICODIAGNÓSTICO = processo complexo que visa produzir hipóteses ou diagnósticos sobre uma pessoa ou grupo.
A avaliação envolve um conjunto de métodos e técnicas, os testes são uma parte (importante, mas não exclusiva) desse processo. 
OBS: testagem psicológica é uma parte/fase (nem sempre presente) do processo de avaliação psicológica. 
Em princípio, não se deve iniciar um procedimento com pessoas/grupos sem um diagnóstico ou uma avaliação inicial. È preciso contextualizar a informação obtida a partir do teste.
OBS: não se deve produzir um diagnóstico com base no resultado de apenas um teste ou mesmo de uma bateria de testes, sendo preciso contextualizar a informação obtida. Em poucas circunstancias, admite-se apenas o uso de teste(s).
Necessário fazer curso de especialização ou pós e leitura sistemática da literatura especializada na área.
TESTE PSICOLÓGICO: instrumento que avalia (mede, faz estimativa) construtos (variáveis latentes) que não podem ser diretamente observados. 
Testes são fundamentais no processo de avaliação psicológica na medida em que são instrumentos objetivos que fornecem informações precisas sobre indivíduos/grupos.
Ex. de construtos: inteligência; ansiedade; otimismo; extroversão etc.
“[...] procedimento sistemático para coletar amostras de comportamento relevantes para o funcionamento cognitivo, afetivo ou interpessoal e para pontuar e avaliar essas amostras de acordo com normas.” (Urbina).
O CFP mantém controle rigoroso sobre testes psicológicos utilizados no Brasil, garantindo que atendam princípios básicos de validade e fidedignidade; ainda assim, a margem de erro estará sempre presente.
Testes devem ser usados de forma adequada.
Instrumentos autorizados pelo CFP. (SATEPSI: site de testes)
Normas: informam como os escores se distribuem na amostra de normatização (população).
O teste psicológico deve permitir que o resultado obtido seja contextualizado/significado/interpretado a partir de normas. 
Os manuais de testes apresentam tabelas com normas para o instrumento (tabela normativa). 
É preciso ter muito cuidado ao se utilizar tabelas de normas de testes. Importante verificar se os participantes da amostra de normatização são representativos, sob risco de interpretações/resultados equivocados.
Curva normal
Nem sempre a distribuição do construto psicológico é normal, utilizando-se distribuição não-paramétrica para desenvolver/interpretar normas.
Amostra normativa é usada para estabelecer a tabela de normas do manual.
Desvio padrão (DP): acima ou abaixo da média. -0,5 e +0,5
Ponto de corte: é um critério diagnóstico. 
A partir de que escore diremos que o candidato está apto? ou que a pessoa tem alta probabilidade de ter um transtorno específico? Encaminha ou não o usuário para atendimento especializado?
Qual erro será cometido com a escolha do ponto de corte? Preciso recorrer à literatura especializada.
Em qualquer ponto de corte, sempre ocorrerá erro falso-positivo ou erro falso-negativo.
ENTREVISTA
Procedimento complexo que requer treinamento especializado.
Diferentes finalidades e vários objetivos.
Roteiro: organizado com o objetivo de colher dados específicos que permitam gerar hipóteses diagnósticas ou produzir comparações entre os entrevistados.
Tipos de entrevistas: varia em função do objetivo e do próprio entrevistador.
1 Estruturadas: segue roteiro preciso, perguntas fechadas que devem ser feitas. Objetivo de colher dados específicos. O entrevistador faz anotações ao longo da entrevista, pq respostas são breves. No geral, não são gravadas.
2 Semiestruturadas: tem um roteiro e um conjunto básico de questões, mas o entrevistador fica livre para conduzir a entrevista para outros rumos e explorar com mais profundidade outras informações trazidas nas respostas. Em geral, deve ser gravada.
3 Informais (não estruturadas): não tem um roteiro preestabelecido, embora o entrevistador tenha questões a serem exploradas. Ouve o entrevistado e em função do conteúdo da fala faz perguntas e/ou observações. Vantagem: descobrir novas informações e explorar um tópico de forma mais aprofundada. Desvantagem: tempo longo para realizar o procedimento. Sempre gravadas.
Entrevista inicial: não-estruturada.
Seleção de pessoal: estruturada ou semiestruturada.
Anamnese: estruturadas ou semiestruturadas (obs: para diagnóstico: livre estruturação: tendenciosidade)
Clínica ou de acompanhamento: variar de acordo com o objetivo e abordagem.
Há várias entrevistas estruturadas e semiestruturadas para fins de diagnóstico. Obs. Jones (2010) publicou importante defesa sobre entrevista não estruturada para fins de diagnóstico clínico.
ex.: Structured Clinical Interview para DSM/SCID-5; Autism Diagnostic Interview (ADI-R)
OBSERVAÇÃO
Método que pode envolver muitas técnicas e requer treinamento e preparação.
Gera muitas informações.
Em maior ou menor escala, está sempre presente nos processos de avaliação individual/grupal.
Realizar anotações e considerações. 
Descrição cursiva (ações do sujeito em ordem cronológica).
Pode ocorrer sozinha ou durante a entrevista e testagem.
Teste: observar detalhes que permitem algumas inferências sobre a atitude do testando em relação à testagem, sobre o estado de ânimo do testando e podem auxiliar na interpretação dos resultados; a despeito de não serem utilizados na pontuação/contabilização do instrumento.
- comportamentos do indivíduo que responde ao instrumento (está prestando atenção na tarefa? faz comentários?)
Entrevista: observar linguagem verbal e não-verbal. 
Gestos, expressão facial, tom da voz, silêncios, hesitações podem trazer importantes informações.
Examinar comportamentos e interações.
Ex.: The Autism Diagnostic Observation Schedule (complemento do ADI-R); protocolo de observação de crianças com suspeita de autismo (PROTEA-R)
3 PASQUALI, L. (Col.). Instrumentação psicológica: fundamentos e práticas. Porto Alegre: Artmed, 2010. (capítulo 3: Teoria da Medida, p. 56-78)
TEORIA DA MEDIDA
Psicometria ou medida em psicologia
- Utilizada em contexto restrito: testes psicológicos e escalas psicométricas.
TEORIA DA MEDIDA: usa números na descrição dos fenômenos naturais (objeto).
Medida = procedimento empírico, sujeito a erro.
- Discussão epistemológica em torno da utilização do símbolo matemático (número) no estudo científico dos fenômenos naturais.
- Utiliza conhecimentos da matemática para construir informações.
Parte numérica não será aplicada 100%, deverá ser feita uma consideração com cautela.
Utiliza o conhecimento matemático, mas um entendimento voltado para as peculiaridades psicológicas, ou seja, utiliza números de forma adequada.
- Modelo quantitativista em ciência. Vantagens ao utilizar da linguagem matemática para descrever seu próprio objeto de conhecimento.
Obs: a ciência tem como referente/objeto os fenômenos da realidade, a matemática tem como objeto de estudo o símbolo numérico, que é um conceito, não uma realidade empírica. Matemática e ciência empírica são sistemas teóricos muito distintos.
Ciência: observação; teste empíricoMatemática: dedução; consistência interna do argumento.
FILME: O homem que viu o infinito.
PROPRIEDADES DA MEDIDA:
A natureza da medida implica em três problemas básicos:
1 Representação (ou isomorfismo)
2 Unicidade da representação
3 Erro
1 Isomorfismo (posso atribuir número?): representação numérica de um fenômeno.
Verificar a possibilidade de atribuição de número: posso de fato atribuir um número para o constructo ou fenômeno que desejo avaliar/medir?
Medida em que os diferentes atributos de um mesmo objeto não diferem em termos de quantidade e sim de qualidade.
Representar com números (objetos da matemática) as propriedades dos fenômenos naturais (objeto da ciência)
Problema central: é justificável designar ou expressar objetos ou fenômenos naturais por meio de números?
Sim, se preservar as propriedades estruturais do número e as características próprias dos atributos dos fenômenos empíricos.
(Justificar a legitimidade de se passar de procedimentos e operações empíricos (observação) para uma representação numérica desses procedimentos.)
2 Unicidade (qual é a melhor medida?): melhor representação numérica do fenômeno de modo que tenha o máximo de precisão, considerando a característica do fenômeno.
Garantir a melhor representação do fenômeno pelo número e considerar que esta representação seja precisa a partir das características do fenômeno.
O número é a única ou a melhor representação das propriedades dos objetos naturais para fins de conhecê-los pelo ser humano?
Alerta: essa representação, ainda que sendo a melhor, apresenta níveis diferentes de qualidade ou precisão, dependendo do tipo de característica dos objetos que se está focalizando. ex.: peso>kg; inteligência>QI
OBS: Essa problemática na unicidade da representação gera os níveis da escala de medida (define se a escala será nominal, ordinal, intervalar etc.).
3 Erro
A medida (observação dos fenômenos empíricos) é sempre sujeita a erros devido a diversos fatores: observação, amostragem ou eventos em que a medida foi realizada (ver tipos de erros). 
Toda e qualquer medida vem acompanhada de erros, assim, o número que descreve um fenômeno empírico deve vir acompanhado de algum indicador de erro provável dentro de limites de aceitabilidade de medida (teorias estatísticas).
OBS: na medida psicométrica, o número se adultera um pouco, perdendo sua identidade pontual e absoluta para se tornar um intervalo em vez de um ponto sem dimensões.
OBS: o fato de o número, na medida, se tornar um intervalo diz que que tem variabilidade (variância), e isso é erro. Na medida, o número, é um número estatístico, um intervalo. O número vem sempre acompanhado de variância (que indica o erro).
Variabilidade = erro.
Na medida de fenômenos naturais, a existência de erro faz com que o número se torne um intervalo a possuir variância/variabilidade, ou seja, é um número estatístico, um intervalo, acompanhado de variância que indica o erro. (não é mais um número matemático inconfundível, um ponto).
A estatística estuda o número como representação dos fenômenos naturais.
TIPOS DE ERROS (erros que não posso cometer): treinamento para não cometer esses erros.
Existência de erros são admissíveis, mas é importante o aprofundamento teórico para aperfeiçoamento constante.
Cuidado ao coletar informação: inferência. Necessidade de validação da informação.
Constitui séria ameaça à tomada de decisões.
OBS: o problema não é a existência de erros, que são inevitáveis, mas identificar as suas fontes e propor meios de reduzi-los. Toda medida tem erros que se tenta evitar para tornar a medida mais específica.
O erro da medida é expresso pelo erro padrão da medida (EPM), que é o valor médio da variância: a medida verdadeira de um atributo se situa entre o valor médio das medidas efetuadas e um erro padrão em torno dele (-1 e +1).
1 Erros de observação (principal fonte de erros, ex.: inferência)
(a) instrumentais: inadequação do instrumento de observação.
(b) pessoais: existem diferentes maneiras de cada pessoa reagir; reações diversas.
(por isso o autoconhecimento é importante na atuação do psicólogo
(c) sistemáticos: fator não controlado, envolto no ambiente de aplicação em si ou externo – variáveis externas.
ex.: uma luz da sala queimar, um carro passar buzinando; medir a temperatura em nível diferente do mar etc.
(d) aleatórios: causa desconhecida ou não cognoscível.
ex.: lote de instrumento com tons idênticos na luz artificial; não fez rapport adequado e algo que aconteceu na vida do sujeito antes da aplicação do instrumento interfere na aplicação resultando em erros.
Fazer rapport com consistência explorando a vida do sujeito.
Verificar as possibilidades reais para aplicação do instrumento.
Se necessário explicar para o sujeito e remarcar.
Ex.: dor, uso de medicamentos, conflitos etc.
2 Erros de amostragem (quem será selecionado?) 
Informação obtida a partir de um conjunto de pessoas (amostra). 
Processo de obtenção dessa amostra = amostragem
Escolha de indivíduos de uma população, pode ocasionar inferências errôneas, sendo necessário considerar a presença de vieses/desvios/erros da amostra em relação às conclusões e inferências que se pretende fazer sobre toda população da qual a amostra foi retirada.
Atentar para a falta de representatividade! 
A amostra deve ser representativa, ou seja, os indivíduos do grupo devem representar as características do que se deseja avaliar. (amostra fidedigna = resultados verdadeiros, sem erros)
(teoria estatística da amostragem)
Legitimidade da medida = ISOMORFISMO (estrito): há preservação das propriedades estruturais do número e dos fenômenos naturais. Isomorfismo entre propriedades do número e aspectos dos atributos da realidade empírica. São propriedades do número: identidade, ordem e aditividade. A medida resguarda as duas primeiras, pelo menos. (Preferencialmente deve resguardar as três.)
OBS: nas ciências psicossociais, a maioria das medidas devem salvar ao menos os axiomas de ordem; se somente salvar os axiomas de identidade (escala nominal), a operação não chega a ser uma medida, mas se trata apenas de uma classificação, pois a única característica do número salva é a identidade.
Utilidade da medida: ver importância da medida.
PROPRIEDADES DO NÚMERO: as propriedades do número sempre devem ser consideradas.
1 Identidade: define o conceito de igualdade, cada número é idêntico somente a si mesmo, tem suas características.
(personalidade)
Ex.: número do CPF; características do sexo masculino difere do sexo feminino
2 Ordem: se baseia na desigualdade dos números em termos de qualidade (todo número é diferente do outro) e magnitude (um número é maior que o outro). Aliás, são diferentes, pq um é “maior que” o outro. “mais que”.
(escala de inteligência: um sujeito que resolve corretamente "maior" número de uma série de problemas do que outro = "mais inteligente")
Ex.: 1º, 3º, 5º ano do curso de Psicologia: qual terá mais conhecimento? Existe uma ordem, ainda que não se saiba o grau de conhecimento.
3 Aditividade: quatro operações básicas. 
Apresenta dois aspectos úteis: origem e intervalo/distancia
ex.: posso falar de diferentes qualidades da rosa como intensidade de aroma, peso, tamanho; mas cada uma dessas qualidades pode aparecer com magnitude diferente de aroma, peso, comprimento (posso medir as magnitudes de cada qualidade). As três qualidades da rosa possuem magnitudes.
Em termos de seus atributos, qualitativamente diferentes, não posso dizer que uma rosa é mais rosa que outra; porém, posso dizer que uma é mais aromática ou mais pesada que outra.
OBS: Qual propriedade de número será atribuído ao fenômeno psicológico/construto?
Compreender as propriedades do número para atribui-lo corretamente 
ex.: atribuir o número de identidade/características à personalidade e número de ordem à inteligência.
OBS: excetuado o caso de igualdade, os números podem ser colocados numa sequência invariável ao longo de uma escala linear (sequência/ordemmonotônica crescente).
OBS: Quanto mais axiomas do número a medida salvaguardar, maior será seu nível, ou seja, mais se aproximará da escala numérica ou métrica e maior será seu isomorfismo entre n-fn.
NÍVEIS/ESCALAS DE MEDIDA (Stevens): elementos numéricos para definir a medida.
(ou ESCALAS NUMÉRICAS DE MEDIDA)
Escalas = são métodos de transformar uma série de fatos qualitativos (atributos) em uma série quantitativa (variáveis). A escala atribui rótulos numéricos aos atributos.
= alocação de objetos/atributos para números (1, 2, 3...) de acordo com algum critério.
Cada escala é composta por itens que são somente uma amostra do possível universo de itens.
Importância: 
- reduz a complexidade dos dados, simplificando a análise ao combinar muitas variáveis em um único valor (escore único). 
- aumenta a fidedignidade da medida final ao reduzir erros nas mensurações.
- utilizar diferentes itens propicia uma avaliação mais compreensiva e acurada.
- podem-se fazer comparações entre variáveis, permitindo o uso de técnicas de correlação estatística.
(ver: http://slideplayer.com.br/slide/10255862/)
- níveis de mensuração: relação entre números e objetos/eventos aos quais são aplicados números.
OBS: Nem todas as medidas são iguais em qualidade. A qualidade da medida depende do grau de isomorfismo que existe entre as qualidades do número e qualidades do fenômeno natural. Há níveis diferentes de correspondência entre n-fn, o que implicará em diferentes níveis de medida (ou seja, diferentes escalas de medida).
- diferenças nos modos como os números podem ser usados
- os tipos de operações que são logicamente viáveis
OBS: São cinco elementos numéricos para definir o nível da medida: identidade, ordem, intervalo (intervalo não igual, igual), origem (natural, não-natural) e unidade de medida. Sendo ordem e origem mais discriminativos dos níveis.
OBS: o fator que define o nível de medida é a característica do atributo medido da realidade/natureza.
1 Nominal (nome; identidade; categoria) = classificar
Número usado somente como rótulo para identificar um indivíduo ou uma classe.
Identificar categorias. Rótulo numérico (nem precisaria ser um número). 
Garanto as características de cada classe.
Ex.: n. CPF em substituição ao nome e sobrenome; n.1 mulheres e n.2 homens
Ex.: cabelo castanho; certo-errado; etnia; gênero (= categorias)
Axiomas salvos: identidade
Estatísticas apropriadas: frequências: %, proporção (p), Mo
2 Ordinal (ordem, posição) = ordenar
Garanto, além das características, a ordem entre as classes (ordem de classificação).
O número identifica posição, mas não a magnitude das diferenças entre eles. 
Os números representam somente postos, mas não quantidade somáveis. Não tem valor atribuído.
Origem arbitrária, a distância entre números não seria igual. Sentido preciso em termos de posição, mas não informa a respeito da distância entre as posições.
Desconheço a ordem de grandeza. (ordem de grandeza = quantidade entre as classes; ex.: 12 em 12 meses, 1 em 1 grau)
Ex.: medir peso de objetos sem ter uma balança e ordenar objetos em termos do mais pesado, surgindo uma ordem, mas sem poder dizer quanto um objeto é mais pesado que o anterior.
Ex.: ordem de nascimento; nível de desempenho acadêmico; menor para o maior; conhecimento do 3ºsem. e do 5ºsem., mas não consigo medir a quantidade de diferença de conhecimento de fato que pode ser grande ou pequena; criança-adolescente-adulto e não idades específicas.
Ex.: cabelo castanho claro ou castanho escuro (mas, não conheço o grau)
Axiomas salvos: identidade e ordem
Estatísticas apropriadas: não paramétricas (não aditivos): mediana (Md), coef. de correlação Spearman (rs), pp
Em psicologia, a maioria das escalas de mensuração é de natureza ordinal.
Escores de posto percentil ou percentil (PP): relato de escores ordenados por classificação. 
Números ordinais disposto numa escala de 0-100. 
Suas posições indicam a percentagem de indivíduos de um grupo que se enquadram em um determinado nível de desempenho ou abaixo dele.
Refletem o posto/posição de um indivíduo em um teste em comparação a um grupo de referência. Referencial: outras pessoas.
Ex.: escore PP 70 indica um nível de desempenho igual ou superior ao 70% das pessoas da amostra.
OBS: diferente de escore percentual: reflete o número de respostas corretas que um indivíduo obtém em meio a um número total possível de um teste. Referencial: conteúdo do teste como um todo.
pp 45º e 50º (são dois escores separados por cinco unidades de posto percentil), a diferença entre elas e o que essa diferença representa em termos do que está sendo mensurado não podem ser equacionadas com a diferença que separa quaisquer outros escores com a diferença de cinco unidades de percentil, como p. ex. 90º e 95º.
3 Intervalar (intervalo; precisão) = escalas de unidades iguais; distância entre os números são significativas.
Arbitrar unidade de medida com variações regulares, ou seja, intervalo igual.
Além das características e das ordens, entendo e conheço quais são os intervalos (a distância/grau entre uma classe e outra, a medida de fato).
Expressa não somente a ordem, mas o tamanho da diferença.
Zero arbitrário.
Qual é a atribuição que se faz em cada intervalo. Conheço a métrica. Há precisão.
Conheço de fato a grandeza de cada classe.
Garanto as características das classes e entendo que existe uma ordem, compreendo/conheço essa ordem.
Ex.: o qto é motivado; o nível de inteligência.
Ex.: inteligência: por classes e para cada classe existe uma variação correta de valores
Ex.: cabelo castanho claro 1, cabelo castanho escuro 0,5
Axiomas salvos: identidade, ordem e aditividade
Estatísticas apropriadas: paramétricas: M, DP, Pearson (r), análise de variância (F de Fischer)
(mais todas as medidas de tendência central: Mo, Md, M)
OBS: quanto menor o intervalo, maior a precisão da medida.
4 Razão
Implica em ter zero verdadeiro ou absoluto (origem natural).
Não é utilizado na psicologia, pois não existe zero absoluto. Ex.: nível de inteligência zero não existe.
Usado somente para contagem de frequencia ou intervalo de tempo. Obs: dizer que um trabalhador A produz três vezes mais que o trabalhador B, não significa que A seja três vezes melhor que B, porque velocidade não é o único índice de desempenho no trabalho, memso em uma linha de montagem.
Comparar as razões dos valores das escalas.
Ex.: peso, altura, distância, velocidade
Axiomas salvos: identidade, ordem e aditividade
Estatísticas apropriadas: m. geométrica, coeficiente, variação, logaritmos
FORMAS DE MEDIDA: diferentes formas/maneiras de se atribuir números às propriedades dos objetos.
1 Medida por lei (número mais exato, “matemática pura”): demonstrar empiricamente que dois ou mais atributos estruturalmente diferentes mantém entre si relações sistemáticas (ex.: S-R; cor-distância)
(dois atributos diferentes e entre eles existe relação sistemática cientificamente demonstrada, estabelecendo-se uma função de covariância entre os dois, ou seja, uma lei.)
Estabelecimento de lei entre duas ou mais variáveis, em que as constantes típicas podem ser medidas indiretamente por meio da relação estabelecida entre as variáveis.
- leis, fatos empíricos
Utilização pontual na PSI. São poucos os casos em que será utilizada justamente em razão da ausência de precisão.
ex.: lei do reforço: toda vez que apresento reforço o sujeito proporciona resposta> lei de causalidade > forneço algo e o sujeito me concede a resposta esperada.
2 Medida por teoria (variáveis, construção da informação por teoria, postulados): não existe lei relacionando variáveis, recorrendo-se a teorias que hipotetizam relações entre atributos da realidade, assim permitindo a medida indireta de um atributo por meio de fenômenos a ele relacionados via teoria.
Importante: garantir instrumentos calibrados para medir os fenômenos com os quais o atributo em questão esteja relacionado pela teoria.
- postulados, axiomas
Hipóteses são pensadase empiricamente testadas.
Os próprios números são usados para validar determinada atuação.
Mais utilizada nas ciências psicossociais, por considerar o erro em razão da imprecisão do ser humano. Margem de erro.
Não se consegue tanto rigor na medida como nas outras ciências.
Testar e verificar se o que se imaginou estava correto ou não.
Psicometria: trabalha com dois parâmetros: a resposta do sujeito (comportamentos/escores) e o critério (TRI, TCT)
- Forma de medida mais usada na ciência psicossocial: medida por teoria
(teoria dos jogos; teoria psicofísica; teoria psicométrica ou teoria dos testes psicológicos: TC/TRI)
(TCT: critério é comportamento futuro)
(TRI: critério é o traço latente)
Comportamentos não são diretamente observáveis.
Aplicam-se instrumentos com auxilio da estatística para acessar tais comportamentos.
Teste utilizado como recurso e não como 100% de verdade/certeza. Precisam de novas informações, novas descobertas.
Quanti e quali complementam-se na construção do conhecimento. (antigos pensadores)
PSI construída por meio de uma sucessão de acontecimentos.
- Estatística básica: análises para comprovar afirmações idealizadas.
Ex.: analise fatorial; correlação; TRI
IMPORTÂNCIA DA MEDIDA
Há vantagem em utilizar métodos de medições em lugar de métodos puramente qualitativos ou descritivos? Sim, se forem superiores em precisão e simulação.
1 Precisão: a despeito de erros, a medida é capaz de definir limites dentro dos quais os reais valores dos atributos medidos se encontram.
Definição de um intervalo mínimo mais provável dentro de pontos extremos do instrumento e, igualmente, da margem de erro tolerada ou provável.
O atributo tem uma magnitude definida dentro de limites (intervalos) estabelecidos.
A pontuação pode variar (0-10, por exemplo). Obter valor mais preciso, e a medida que vai aumentando os números, a estatística vai dando valores mais aproximados e aumentando a possibilidade de erros.
Quanto maior a quantidade de informações, maior a quantidade de erros possíveis.
Medida de erro tolerável: -0,5 e +0,5.
2 Simulação: conhecendo com precisão as relações entre componente em jogo e suas magnitudes, pode-se utilizar modelos matemáticos para simular efeitos que queremos estudar e que, de outro modo, seria impossível ou impraticável pesquisar.
Manipulação da realidade pode ser difícil, custosa, impossível ou eticamente condenável.
É ético ficar testando crianças e classificá-las desde cedo? Não. Como não é ético ficar testando bomba atômica. 
Mesmo assim, é preciso ter cautela com essas simulações.
4 URBINA, S. Fundamentos da testagem psicológica. Tradução de Cláudia Dornelles. Porto Alegre: Artmed, 2007. (caps. 2 e 3, p. 43-120)
ESTATÍSTICA BÁSICA PARA TESTAGEM E FUNDAMENTOS EM INTERPRETAÇÃO DE ESCORES
(CAPÍTULO 2: ESTATÍSTICA BÁSCIA PARA TESTAGEM)
Técnicas estatísticas permitem análise de dados.
MENSURAÇÃO: envolve o uso de certos dispositivos ou regras para atribuir números a objetos ou eventos.
Fenômenos medidos tronam-se mais objetivos.
Analisar, categorizar e quantificar sistematicamente fenômenos observáveis.
Os fenômenos consistem em amostras cuidadosamente escolhidas de comportamentos, as quais se aplica um sistema numérico ou categórico segundo padrões preestabelecidos. 
VARIÁVEIS: qualquer coisa que varia. Muitas variáveis no mundo.
São dimensões, fenômenos, que o pesquisador/psicólogo elege da realidade para estudar.
1 Discretas (dados categóricos): gama finita de valores e contável. Em princípio, podem ser calculadas precisa e acertadamente (valores exatos). Escalas nominais e ordinais (se encaixar sem sequência). Gráficos de pizza ou barra.
(a) dicotômicas: assume apenas dois valores (ex.: sexo, cara-coroa, certo-errado etc.)
(b) politônicas: assume mais de dois valores (ex.: estado civil, etnia etc.)
Ex.: Qual foi o instrumento utilizado? Teste de Cloyse.
Em que consiste: avaliar a compreensão de leitura.
O que é importante saber além da compreensão e leitura, se variam em relação à mulheres-homens, idades = se varia, em quais dimensões?
Artigo: em “participantes”: variáveis = cursos (4); idade (17-52); sexo (mulheres-homens)
Cursos: nominal (características: medicina, odonto, psico, direito)
Idade: intervalar (m= 21a9m; dp= 4a9m): conheço a grandeza, existe uma métrica!
Sexo: nominal (características)
A palavra pode estar certa ou errada: discreta, dicotômica, nível de medida por categoria (nominal).
2 Contínuas (dados métricos): variações infinitas e não podem ser realmente contadas. São medidas com escalas intervalares ou de razão (ponto zero verdadeiro), que podem ser convertidas em classes/categorias e manipuladas em escalas nominais ou ordinais. Mensurações são aproximações mais ou menos precisas. Histogramas ou polígonos de frequência.
Ex.: tempo, distância, temperatura etc.
Quase sempre, na testagem psicológica, estamos interessados em variáveis contínuas
Ex.: graus de integridade, extroversão, ansiedade etc.
Mensuradas com instrumentos/ferramentas (testes ou inventários) que não são tão precisos.
Atentar para potenciais fontes de erros e procurar estimativas pertinentes de erro (estimar margens de erro).
Resultados são inexatos, são estimativas, comportam erro. Sempre que os escores de um teste são relatados, deve ser explicitado o fato de serem estimativas, bem como, divulgar, juntamente com as informações interpretativas, os limites dentro dos quais os escores podem variar e os níveis de confiança para esses limites.
Resultados dos testes, em geral, são expressos em escores, que são números com sentidos específicos, cuja limitação e relatividade devem ser conhecidas para evitar inferências equivocadas. Limitações identificadas a partir dos níveis de medida.
CONSTANTES: qualquer coisa que não varia. Poucas constantes no mundo. Ex.: pi = 3,1416
TIPOS DE ESTATISTICA
(Artigo: ver resultados)
1 Descritiva: utiliza números e gráficos para descrever, condensar e representar dados.
Resumir dados de modo a facilitar compreensão, representando-os graficamente ou condensando-os em estatísticas.
- distribuição de frequência: organização de dados brutos, permitindo inspeção.
Número de vezes (ou frequência) que cada escorre ocorreu e a percentagem de vezes que ocorreu.
Frequência acumulada ou percentagem cumulativa = pp (percentil) (p. 54)
- polígono de frequência: eixo vertical (ordenada, eixo y = representar a frequência em que cada valor ocorre na distribuição) e eixo horizontal (abcissa, linha de base, eixo x = representar amplitude de valores da variável em questão).
Descreve a tendência central e variabilidade dos dados numéricos.
2 Inferencial: baseados na teoria das probabilidades, utiliza dados para estimar valores populacionais baseados em valores de amostras ou para testar hipóteses
Principais objetivos: estimar parâmetros populacionais a partir de dados de amostras e teoria da probabilidade.
Parâmetros: são números matematicamente exatos ou constantes derivados de populações
3 Derivada: números que descrevem características variáveis ou conjunto de dados derivados de amostras 
Ex.: M, DP, coef. de correlação etc.
MEDIDAS DE TENDÊNCIA CENTRAL
1 Moda (Mo): ocorrência mais frequente de uma distribuição. Obs: bimodal, multimodal.
Obs: se a distribuição for bimodal ou multimodal é necessário considerar a possibilidade de problemas de amostragem ou características especiais da amostra.
2 Mediana (Md): valor que divide duas metades. Valor do meio, independente dos extremos
Muitas vezes o valor da mediana não bate com o valor da média.
3 Média (M ou µ): soma de todos os valores da distribuição e divisão do total pelo número de casos da distribuição. Representa a média de escores (pontuações) ex. artigo: 19,49 maior concentração de acertos.
Considera os extremos, mediana não.
Ex.: 2, 2, 2, 2, 3, 3, 3, 8, 11 = Mo (2), Md (3), M (4)
MEDIDAS DE VARIABILIDADE
Descrevem quanta dispersão existe em um conjunto de dados.
Sem diferençasindividuais não haveria variabilidade. 
Quanto maior a quantidade de variabilidade entre indivíduos em termos de características avaliadas, mais precisamente poderemos fazer distinções entre eles. (maior variabilidade, mais distinções) 
1 Amplitude: distância entre dois pontos extremos de uma distribuição.
2 Distância semi-interquartílica: metade da distância interquartílica (DIQ).
DIQ: amplitude entre Q1 e Q3. Engloba os 50% que ficam no meio da distribuição. Distância entre os pontos que demarcam o topo do primeiro (Q1: primeiro quartil ou 25º pp) e do terceiro (Q3: terceiro quartil ou 75º pp) quartos de uma distribuição.
3 Variância: representa a variabilidade média. (é a média da soma dos quadrados).
Preciso saber o quanto as informações estão variando na distribuição.
Cálculo que se faz, muda a média. A maioria dos estudos não tem a variância pq provoca modificação da métrica que o próprio calculo realiza. 
Artigo: métrica: de 0-40 pontos, valendo 1 ponto cada acerto.
4 Desvio padrão (d ou DP ou α): raiz quadrada da variância.
Representa quanto as pontuações estão longe/variando em relação à média. Quanto estão variando.
Representa diferenças individuais ou desvios em um conjunto de dados calculados a partir da média (ponto de referência comum).
Medida de variabilidade média de um conjunto de escores.
Quintessência do índice de variabilidade de uma distribuição e escores. Medida primordial de variabilidade.
-4 e +4
Artigo: raiz quadrada de 26,11 (variância) chega no 5,11 (desvio padrão)
Quanto maior a gama de desvio padrão, maior a gama de pontuações que se tem: de 0-31
De uma média 20, tenho desde valores 0 à 31, representando um desvio padrão de 5,11.
Há um conjunto de pontuações distribuídas de forma grande. Se essa distribuição fosse menor, o desvio seria menor. Variabilidade seria menor, desvio padrão menor.
(focar/atentar: na média e no desvio padrão)
(se os valores estão longe ou perto da média)
CURVA NORMAL
Propriedades:
- formato de sino
- bilateralmente simétrica
- caudas se aproximam da linha de base, mas nunca tocam, limites ao infinito (±∞)
- unimodal: único ponto de frequência máxima
- Mo, Md e M coincidem no centro da distribuição
- distribuição normal padrão: µ=0 e α=1
- área entre +1α e -1α = 68,26% (2/3 da curva: 2x34,13%)
- área entre +2α e -2α = 95,44% (quase a curva inteira)
 
Na distribuição normal, as diferenças entre escores de postos (percentis) são sempre maiores nos extremos/caudas da distribuição do que no meio, onde se agrupam a maioria dos escores de teste.
Usos inferenciais do modelo de curva normal: uso de duas noções inter-relacionadas: a média de cada distribuição hipotética de amostragem seria igual ao parâmetro populacional e o desvio padrão da distribuição de amostragem seria o erro padrão das estatísticas em questão.
- distribuições de amostragem: distribuições hipotéticas de valores derivadas de uma população.
Parâmetro populacional: uso de estatística inferencial.
- erro padrão (EP): desvio padrão de uma distribuição de amostragem
Erro padrão da média é equivalente ao desvio padrão da distribuição de amostragem hipotética das médias.
Somar e subtrair 1α da média da amostra nos dá um intervalo de confiança de 68% para a média populacional, porque 68% da área sob a curva normal encaixa-se dentro de ±1α. Se quisermos fazer uma afirmação com nível mais alto de confiança, podemos escolher um número de confiança maior selecionando um número maior de unidades de EP. O segmento ±2α engloba 95,44% da área sob a curva normal.
DISTRIBUIÇÕES NÃO-NORMAIS
Implicações significativas para os dados dos testes
1 CURTOSE: aspecto achatado ou pontiagudo da curva em uma distribuição.
Diz a respeito da concentração da pontuação que se tem em torno da média.
Significado: Platicúrtica: maior variabilidade. Leptocúrtica: menor variabilidade, tendência central dos escores.
Extremidades baixa (esquerda) e alta (direita).
Quanto mais pontuda, as pontuações se concentram em torno da média.
Quanto mais achada mais distantes e maior a variabilidade das pontuações.
Artigo: 2,58 = platicúrtica = resultante da variabilidade de dispersão das pontuações
 
2 ASSIMETRIA (skewness = Sk): pendendo para o lado esquerdo ou direito.
Falta de simetria na maior parte dos valores da escala.
Frequencia (eixo y) x escores do teste (eixo x: baixo---------alto)
Curva simétrica positiva e curva simétrica negativa: representa somente a distribuição dos dados.
Obs: não confunda com valores
Artigo: -0,83
O significado da assimetria em relação à distribuição de escores de teste é fácil de ser identificado:
- negativamente assimétrica: a maioria das pessoas teve escores altos (acima da média).
- positivamente assimétrica: maior parte das pessoa teve escores baixos (abaixo da média).
Na fase de testagem, a distribuição ajuda a determinar ajustes no teste. 
Ex.: teste voltado para estudantes universitários em que a distribuição dos escores de uma amostra representativa desta população for negativamente assimétrica, significa que o teste pode ser fácil demais, devendo acrescentar itens mais difíceis para deslocar a maior parte dos escores na direção do centro da distribuição.
Macete: http://admcomentada.com.br/artigos/macete-assidf/
 
 
CORRELAÇÃO: grau pelo qual as variáveis estão relacionadas/associadas.
O grau e a direção da correlação entre variáveis é medido por variados tipos de coeficientes de correlação.
Coeficientes de correlação são números que podem flutuar entre: -1,00 e +1,00.
Obs: 
- grau de correlação é indicado pelo número do coeficiente; direção da relação é indicada pelo sinal.
Ex.: -0,80 e +0,80 indicam o mesmo grau de correlação. Uma correlação será baixa a medida que se aproximar do zero.
- alto grau de correlação não significa relação de causalidade entre variáveis.
- alta correlação permite fazer predição, pois implica uma certa quantidade de variância comum/compartilhada.
- r de Pearson (correlação x-y)
Escores de testes precisam oferecer informações a respeito de outras variáveis significativas, ou seja, não apenas estatísticas univariadas. Estatísticas bivariadas ou multivariadas.
Métodos correlacionais são técnicas usadas para obter índices (coeficientes de correlação) do grau em que duas ou mais variáveis estão mutuamente relacionadas.
Artigo(resultados): “Verificou-se, então, a correlação dessa nova variável com a dificuldade dos itens. Essa correlação foi de 0,62 (p< 0,001), indicando que 38,4% da variância da dificuldade foi prevista em função do conhecimento da classe gramatical de cada palavra.” 0,62 é correlação moderada.
Necessário assumir uma teoria para saber se correlações são fracas, moderadas ou altas.
1 Correlação linear: a direção e a taxa de mudança de uma variável são constantes em relação às mudanças da outra. Em gráfico, formam um padrão elíptico reto ou quase reto. 
(a) positiva (sobe)
Material entregue: área A e B dão indicação de correlação positiva: quando sobe uma pontuação (ex.: compreensão de leitura; habilidade social) a outra sobre também (ex.: nível de inteligência; vendas).
(b) negativa (desce)
Ex.: quanto maior o nível de escolaridade dos pais, menor a quantidade de filhos
Ex.: quanto maior o desempenho acadêmico, menor a procrastinação
Se não houver correlação, os pontos não se alinham (nuvem): podemos pressupor que os dois conjuntos de dados não compartilham uma fonte comum de variância.
Gráficos de dispersão: representação gráfica dos dados bivariados.
Cada “x” não é uma pontuação específica, mas representa um conjunto de valores.
Correlação forte significa que a medida em que os valores de uma variável aumentam ou diminuem existe uma quantidade correspondente de mudança nos valores da outra variável.
 
Escore padrão ou escore z: representa a distância entre cada valor em uma distribuição e a média desta distribuição, expresso em termos de unidade de desvio padrão para essa distribuição.Forma mais compacta de expressar a relação entre duas variáveis.
(CAPÍTULO 3: FUNDAMENTOS EM INTERPRETAÇÃO DOS ESCORES)
ESCORES BRUTOS: número que resume ou representa alguns aspectos do desempenho de uma pessoa nas amostras de comportamento selecionadas e observadas que configuram os testes psicológicos.
Não transmitem qualquer significado.
Escores altos podem ser favoráveis ou desfavoráveis. Necessário referencial. 
Na análise final, o significado dos escores dos testes deriva dos referenciais que usamos para interpretá-los e do contexto no qual eles são obtidos.
REFERNCIAIS PARA INTERPRETAÇÃO DE ESCORES
1 NORMAS: desemprenho do testando referenciado numa distribuição normativa.
Pergunta: Como o desempenho deste testando se compara ao de outros?
(testes de habilidade e personalidade)
Normas em tabelas ou estatísticas descritivas (µ, α, f).
Grupos de referência: compõem a amostra normativa ou de padronização
(a) normas desenvolvimentais: progressão ordenada de um estágio comportamental para outro mais avançado; a sequencia pode ser convertida em escala ordinal. Ex.: Gesell; Piaget
- idade mental (QI)
- séries escolares
Obs: todas as normas desenvolvimentais são relativas, exceto as que refletem uma sequência/progressão comportamental eu é universal em seres humanos: sequencias naturais.
(b) normas intragrupos: localizar o desempenho de um estando em uma distribuição normativa, importando a verificação da composição da amostra normativa ser representativa do grupo de indivíduos para os quais o teste está voltado. 
A amostra precisa ser suficientemente grande para garantir a estabilidade dos valores obtidos a partir de seu desempenho. O fato de as informações normativas serem recentes também é importante, testandos comparados com padrões contemporâneos. (p. 90, Urbina: perguntas importantes sobre a amostra normativa).
Escore percentil (escore T): indica a posição relativa de um testando comparada a um grupo de referência como a amostra de padronização. (posto percentil)
Representa a percentagem de pessoas no grupo de referência que teve escore igual ou inferior a determinado escore bruto.
Todas as pontuações do instrumento estão organizadas em uma métrica. O percentil é organizado por uma métrica ex.: de 5-95
Material entregue: “Tabela de pontos percentílicos para amostra composta por homens”. O escore, a pontuação, sozinho não diz nada. Interpreta-se com base nas normas e nos critérios.
Ex.: o que uma pontuação de 80 de QI representa? O que 80 significa sobre o sujeito. Necessário ter um entendimento do escore bruto a partir de uma tabela de percentil. Pego o escore bruto e identifico na tabela de percentil para obter uma classificação: sujeito acima, na média ou abaixo da média.
Não se olha pelo escore bruto, e sim pela tabela que foi construída a partir de uma amostra para obter esses valores de classificação.
Para cada uma das subescalas (S1, S2 e S3), pego a pontuação que obtive (ex.: 5,30) e identifico qual é o posto percentil referente (ex.: 30).
Joga na régua para saber qual é o significado? (a classificação do sujeito)
Essa tabela está no manual.
EFS (escala fatorial de socialização) = escala total das subescalas S1 S2 S3
Teto de teste e Solo de teste: os indivíduos empregados na padronização de um teste efetivamente determinam os limites inferior e superior do desempenho no teste. Está mais intimamente ligado à dificuldade dos testes.
Escore padrão (escore Z): transformar escores brutos em escalas que expressem a posição dos escores em relação à média em unidades de desvio padrão. 
Expressa a distância entre um escore bruto e a média do grupo de referência em termos do seu desvio padrão.
2 CRITÉRIO: desempenho do testando é comparado a um critério/padrão específico. 
Ligações específicas entre os escores no teste e o desempenho no critério.
Uso de escores de corte ou faixas de escore que separam a competência da incompetência ou demarcam diferentes níveis de desempenho.
Objetivos:
- avaliar o grau que os testandos são proficientes em certas habilidades ou domínios de conhecimento
- pontuados de tal forma que o desempenho de uma pessoa não influencia o resultado de outras; enquanto os teste referenciados em normas procuram ordenar e localizar um ou mais indivíduos em relação a outros. Critérios buscam avaliar o desempenho de indivíduos em relação ao construto em si.
(a) domínios de conteúdo
Pergunta: quanto do domínio especificado o testando conhece? (escores de percentagem)
(b) avaliação de desempenho
Pergunta: o testando demonstra competência na habilidade em questão? OU qual é a proficiência deste testando/grupo no contínuo de competência relevante para esta tarefa em particular? 
(escore de corte: julgamento mais subjetivo)
(c) predição de desempenho
Pergunta: que nível de desempenho no critério podemos esperar de uma pessoa que obtém este escore? OU o desempenho do testando neste teste é suficiente para determinar o nível desejado de desempenho no critério em uma dada tarefa?
Tabelas/gráficos de expectativa
5 PASQUALI, L. Psicometria: teoria dos testes na Psicologia e na Educação. 4. ed. Petrópolis: Vozes, 
(cap. 4, p. 79-107)
(O MODELO DA PSICOMETRIA MODERNA)
- Curva Característica do Item (CCI)
- Pressupostos da TRI: unidimensionalidade e independência local
- Modelos logísticos de 1, 2 e 3 parâmetros
- Análise de itens: semântica e análise de juízes 
(obs: validade de conteúdo: representatividade dos itens)
Por meio da teoria da medida, a Psicometria mensura de forma adequada e comprovadas um conjunto de comportamentos que se deseja conhecer melhor.
Modelos de Psicometria: TCT e TRI
TCT: preocupa-se em explicar o resultado final total, ou seja, a soma das respostas dadas a uma série de itens expressa no chamado escore bruto/total. Produzir testes de qualidade.
TRI: interessa-se por cada item e quer saber qual é a probabilidade e quais os fatos que afetam esta probabilidade de cada item individualmente ser acertado ou errado ou de ser aceito ou rejeitado. Produz itens/tarefas de qualidade.
 
TEORIA DE RESPOSTA AO ITEM (TRI)
Modelo de traço latente.
Traços latentes: estimar os níveis de várias habilidades/traços/construtos psicológicos não-observáveis, subjacentes ao comportamento observável dos indivíduos, demonstrados por usas respostas ais itens dos testes.
Dados são usados para calibrar os itens dos testes em relação a um ou mais parâmetros e derivar estimativas de probabilidade da quantificação de habilidade, ou nível de traço, necessária para responder a cada item de uma certa maneira.
Os modelos de TRI podem produzir estimativas de parâmetros de item que são invariantes entre populações, ou seja, estimativas não estão atreladas necessariamente ao desempenho de um grupo de referência específico. Os dados das respostas aos itens podem ser interpretados em temos de uma dimensão de habilidade ou traço.
CAT: testagem adaptativa computadorizada
Coloca itens e pessoas numa escala comum.
TCT – 4 limitações:
1 medidas são dependentes das características da amostra de sujeitos
(TRI: característica do item do independente da amostra)
2 avaliação das aptidões dos testandos também depende do teste utilizado
(escores do examinando independente do teste utilizado)
3 definição de fidedignidade (precisão) é fonte de dificuldade
(modelo ao nível do item ao invés do teste)
4 orientada para o teste total e não para o item individual
(modelo que oferece medida de precisão para cada aptidão, em todos os seus níveis, e não apenas em níveis medianos)
AXIOMAS FUNDAMENTAIS DA TRI 
1 O desempenho do sujeito na tarefa/item é explicado em função do conjunto de traços latentes (habilidades).
Desempenho (efeito). Traços latentes (causas)
2 A relação entre desempenho e conjunto e traços latentes pode ser descrita por uma equação monotônica crescente, CCI. 
Sujeitos com maior aptidão terão maior probabilidade de responder corretamente ao item e vice-versa.
- probabilidade de resposta correta ao item(eixo y) e habilidade/aptidão (θ) (eixo x)
CCI: indica a probabilidade de acerto em função da habilidade da pessoa que o responde e da dificuldade do problema.
Item calibrado = com parâmetros conhecidos.
 
Ogiva monotônica crescente ou curva característica do item (CCI).
Analisando-se as respostas certas aos itens especificados, pode-se inferir sobre o traço latente do sujeito, hipotetizando relações entre as respostas observadas deste sujeito ao nível do seu traço latente.
PRESSUPOSTOS DA TRI
1 Unidimensionalidade: há apenas uma aptidão/fator dominante (θ, teta) (em medição) responsável pela realização de um conjunto de tarefas (itens de um teste).
Itens analisados medem o mesmo traço latente dominante em função do qual as respostas de cada item são dadas.
Obs: é pacífico que qualquer desempenho humano seja multideterminado, mas aqui, para se satisfazer esse postulado, admite-se existir uma aptidão/fator dominante responsável pelo conjunto de itens.
- verificar correlação entre itens, se representam o mesmo construto
- garantir que todos os itens estejam avaliando o mesmo construto (única dimensão).
Obs: precisa da TCT com a análise fatorial para garantir a TRI. Agregar, não excluir.
2 Independência dos local: não há correlação entre respostas.
As respostas dos sujeitos para quaisquer dos itens são estatisticamente independentes. O desempenho do sujeito num item não afeta o desempenho em outro item.
A resposta do sujeito para uma questão não ajuda a resposta para outra questão.
Os itens são respondidos em função do traço latente dominante, não em função da memória ou outros traços latentes.
OBS: evita efeitos da aprendizagem: o aumento do escore pode ser atribuído à exposição anterior aos itens do teste ou itens semelhantes.
Ainda que improvável que os comportamentos do sujeito não estejam correlacionados, a independência total afirma que se houver correlação, essa se deve a outros fatores que não o fator dominante (traço latente medido).
MODELOS LÓGICOS DE 1, 2 e 3 PARÂMETROS
Distinguem-se pelo número de parâmetros que utilizam para descrever o item.
a: discriminação
b: dificuldade
c: acerto ao acaso (chute)
Probabilidade de acertar ou errar o item = 0-1, com média de 0,5.
Quando uma pessoa tem habilidade igual ao índice de dificuldade do item, as chance são de 50% de acerto. A medida que sua habilidade aumenta em relação à dificuldade do item, suas chances de acertá-lo serão maiores que 50% e vice-versa.
O teta do sujeito varia de mais infinito a menos infinito. 
Não se recorta o sujeito em habilidade máxima ou mínima.
 
 
- ex.: probabilidade de 0,5 de acerto do item 1 e item 2 a θ=0
- invariância da aptidão: θ independe dos itens utilizados.
- o que varia é a probabilidade de acerto a partir de θ.
- se houver coincidência (invariância de θ e/ou invariância de parâmetros), então os itens dos testes se distribuirão em torno de uma linha reta (= correlação assimétrica positiva perfeita)
TRÊS PARÂMETROS: representados por gráfico ou número
1 parâmetro: b (dificuldade do item)
Modelo de Rasch. 
Quanto maior for b, maior deve ser o nível de aptidão exigido para que o examinando tenha chance de 50% de acertar o item.
Mais habilidades, maior a probabilidade de acertar o item. 
Menos habilidades, menor probabilidade de acertar o item.
Parâmetro de localização: curva localizada mais para esquerda do eixo y, mais fácil, pq exige menos habilidades do sujeito para acertar o item; mais para direita eixo y, mais difícil. 
Negativa (b<0): mais fácil o item. Positiva (b>0): mais difícil. (ver material) 
Quanto maior o valor negativo mais fácil, quanto maior o valor positivo mais difícil.
Gráfico: escore padrão com µ=0 e desvio padrão=1, os valores de b tipicamente situam-se entre -2 (itens fáceis) e +2 (itens difíceis)
Artigo: tabela p. 554: quanto mais variáveis se estuda do item, mais vai variando os valores.
2 parâmetros: a, b (discriminação, dificuldade)
Bimbaum
Representado pela inclinação da curva (ângulo) no ponto de inflexão.
Sempre pensar nas voltinhas das curvas, inclinação.
Quanto consigo discriminar/diferenciar as habilidades do sujeito? 
Maior a inclinação da curva, mais discriminativo. Menor inclinação da curva, menos discriminativo.
Quanto mais discriminativo for o item, mais se consegue separar as habilidades das pessoas. 
Pode variar de 0-∞, mas tipicamente varia entre 0-2.
Quanto maior o valor, mais discriminativo é o item (maior o valor). Num teste, o que ficaria é o item que tem maior discriminação, conseguindo-se diferenciar mais as habilidades do sujeito.
3 parâmetros: a, b, c (discriminação, dificuldade e acerto ao acaso)
Lord
Expresso pela assíntota inferior da curva.
Quanto o rabicho está se distanciando do eixo, se estiver bem para baixo não estou considerando o chute, se estiver mais para cima, estou considerando o chute, pq existe o aumento da probabilidade de acertar o item.
Mesmo sujeitos com baixa habilidade, tem probabilidade de acerto em função do chute. 
Ex.: sujeito com habilidade -3 acerta ao item, só pode ter chutado ou teve sorte por acertar, pois supostamente não tem habilidade nenhuma.
Ver p. 90, Pasquali
Links importantes:
https://pt.slideshare.net/JoaoAlessandro/aula-05-grficos-estatsticos2
https://www.youtube.com/watch?v=-MYBbIt2xdk
https://pt.wikipedia.org/wiki/Gr%C3%A1fico_de_dispers%C3%A3o
http://www.blogdaqualidade.com.br/diagrama-de-dispersao-ou-de-correlacao/
No TRI, o desempenho do sujeito numa tarefa/item, ou seja, a probabilidade de resposta correta, depende de: 
(a) aptidão do sujeito (θ)
(b) parâmetros dos itens (a, b e c)
Importância dos parâmetros
Invariância dos parâmetros constitui ponto central na TRI e afirma que se pode estimar:
- escores dos sujeitos independentemente do teste utilizado. θ independe dos itens utilizados.
- parâmetros dos itens independentemente da amostra de sujeitos utilizada
Itens constituem a representação comportamental do traço latente.
Há dois tipos de análise de itens: teórica e empírica/estatística (análise gráfica e algébrica)
Gráfica: TCT ou escore total
Algébrica: TCT e TRI
1 Análise teórica: análise feita por juízes e visa estabelecer compreensão dos itens (análise semântica) e a pertinência destes ao atributo que pretende medir. 
Também chamada de análise de conteúdo.
Verificar adequação (conformidade) da representação comportamental do atributo latente.
OBS: a TRI permite estabelecer os mesmos parâmetros independentemente da amostra utilizada, daí a possibilidade de incluir novos itens diretamente comparáveis aos já inclusos no banco de itens.
Análise semântica dos itens: os juízes são sujeitos da própria população para a qual se quer construir o teste.
Verificar se os itens são inteligíveis.
Análise dos juízes: os juízes devem ser peritos na área do construto, ajuizando se os itens estão se referindo ou não ao traço em questão. Opinião de especialistas.
Dizer se o item constitui representação adequada do traço latente (fator dominante).
2 Análise empírica: avaliação de uma série de parâmetros que devem possuir para apresentarem-se como tarefas/itens adequadas para o que o teste se propõe medir.
Parâmetros: unidimensionalidade, dificuldade, discriminação, acerto ao acaso, tendenciosidade de resposta, validade, precisão.

Outros materiais