Baixe o app para aproveitar ainda mais
Prévia do material em texto
Noções de estatística aplicada à avaliação psicológica · A Estatística pode ser definida como o conjunto de ferramentas para coleta, organização, análise e interpretação de dados experimentais; · O reconhecimento da Psicologia como ciência demandou a adoção de métodos que viabilizassem a quantificação dos fenômenos psicológicos – século XIX; · Evolução da testagem psicológica – refinamento dos métodos estatísticos. · O objetivo não é formar estatísticos; é instrumentalizar estudantes e profissionais da Psicologia para uma boa utilização de manuais de testes psicológicos e aplicação em pesquisa. · O objeto de estudo em Estatística é um conjunto de dados que pode constituir uma população ou uma amostra; · População é um conjunto de elementos; · Amostra é um subconjunto da população, é uma parte da população selecionada com base em algum critério – geralmente buscamos amostras representativas; · Uma amostra representativa é aquela que mantém as características da população; · Quanto menos aleatória a seleção da amostra, maior a possibilidade de tendenciosidade dos dados. · Ideal é que a amostra selecionada: 1. Tenha quantidade de pessoas suficientes; 2. Não tenha características próprias que a diferenciem do “normal” da população; 3. Seja escolhida de maneira aleatória · O significado dos números · Números podem ser usados de várias formas – sistema para classificar diferentes níveis de mensuração a partir das relações entre os números e os objetos ou eventos aos quais são aplicados; · Níveis de mensuração = escalas – especificam diferenças no modo como os números podem ser utilizados; · As variáveis são, então, classificadas de acordo com o nível ou escala de mensuração: Nominal, ordinal ou Intervalar/Razão. · Escalas nominais · Caracterizadas por números que apenas diferenciam ou rotulam as categorias; Nível mais simples de classificação; · RG, CPF; sexo, estado civil – dados que derivam da designação de pessoas, objetos ou eventos a categorias ou classes em particular (variáveis categóricas); · Propriedade da identidade: todos os membros de uma mesma categoria devem receber o mesmo número; duas categorias não podem compartilhar o mesmo número; · Operações empíricas não são aplicáveis, apenas a contagem de frequência dentro de uma categoria. · Escalas ordinais · Envolve números que, além de diferenciar, hierarquizam as categorias; · Além de identidade, têm mantida a propriedade de ordem de classificação – do maior para o menor ou vice-versa; · Informação sobre a posição é precisa, mas não indica a distância entre elas. · Escalas intervalares · Apresentam números que expressam diretamente uma quantidade, seguindo uma métrica; · Diferença entre dois números consecutivos reflete uma diferença igual entre os objetos ou eventos que os números representam; · Exemplo: uso dos dias para marcar a passagem do tempo; atribuição de valores numéricos aos indivíduos; ex.: rendimento acadêmico, pontuações em um teste. · Limitador: inexistência de um ponto zero (ponto de partida) verdadeiro – para o calendário, por exemplo: diferentes culturas determinam pontos de partida diferentes. · Escalas de razão · Têm o mesmo funcionamento das escalas intervalares, mas têm um ponto zero verdadeiro ou absoluto, que representa nenhuma quantidade do que está sendo medido; · Exemplos das ciências físicas: tempo, peso, distância/extensão; · Psicologia: escalas de razão são utilizadas quando se tomam medidas em termos de contagem de frequência ou intervalo de tempo, e eles permitem a existência de zeros verdadeiros. · Sobre os níveis de mensuração · De escalas nominais para racionais (de razão) – números que transmitem menos informação a números que transmitem mais informações; · Isso requer a certificação de que todas as informações que os números contêm sejam preservadas ao longo de todas as transformações ou manipulações que lhes forem aplicadas; · A adequada compreensão dos níveis de mensuração ajuda a manter a relatividade do sentido dos números na perspectiva correta; · Resultados de testes são expressos em escores (números com sentidos específicos) · Se estas limitações não forem compreendidas, podem ser feitas inferências equivocadas a partir de escores. · Tipos de estatística: · Uso de números é generalizado na testagem psicológica – necessidade de aplicação da estatística; · A estatística é um conjunto de ferramentas utilizadas para a coleta, tabulação, análise e interpretação de um conjunto de dados experimentais; · A Estatística pode ser dividida em duas grandes áreas: Descritiva e Inferencial; · Estatística descritiva · Nessa categoria enquadram-se as médias salariais, taxas de inflação, índice de desemprego, distribuições de frequência – notas de prova, idade, alunos por período, etc; · Escores com grandes amplitudes requerem distribuições de frequência agrupadas – escores; · Agrupados em intervalos de tamanho conveniente – o que se ganha em “enxugamento” da informação, se perde em detalhamento. · Tabelas de distribuição simples: · Tabelas de distribuição cruzada: · Apresentam a distribuição de frequências de duas variáveis simultaneamente. · Gráficos: · O tipo de gráfico adequado para cada variável depende do tipo de variável. · Variável com poucas categorias – gráfico de setores (pizza ou torta) · Variável com muitas categorias, variáveis ordinais – gráficos de barra · Séries temporais – gráficos de linhas · Estatística descritiva: além de ajudar na visualização de dados, proporciona ferramentas que nos permitem resumir numericamente suas propriedades – descrição da tendência central e da variabilidade dos dados numéricos. · Medidas de tendência central: · São valores que trazem informação sobre a região em torno da qual os dados estão posicionados; · Uma medida de tendência central de um conjunto de dados fornece uma indicação do escore típico (mais comum) deste conjunto de dados; · Número único que representa o que é médio ou típico; · As medidas de tendência central mais utilizadas são: Média, Mediana e Moda – cada uma com vantagens e desvantagens, dependendo do tipo de dados e da distribuição que se quer descrever; · Importante: ao inspecionar um conjunto de dados, verificar onde a maior quantidade deles pode ser localizada, bem como seu valor mais representativo ou central. · Mediana · Valor que divide o conjunto de dados ordenado em duas partes com igual número de observações; · Identifica e representa a pontuação que está no meio da distribuição de frequências; · Passo 1: organizá-las da menor para a maior; · Passo 2: determinar o valor que está no centro (utilizando a fórmula ou inspecionando os dados). · Em distribuições pares, a mediana será a média entre os dois valores centrais. · Moda · Definida como o valor mais frequente de um conjunto de dados – pode haver mais uma moda – distribuições bimodais; · Única que pode ser utilizada para representar variáveis do tipo nominal; · Média ou média aritmética · Definida como a soma de todas observações da variável X, dividida pelo número de elementos do conjunto de dados; · Frequentemente a média aritmética é o valor que melhor representa um conjunto de dados; · Não é preciso dispor os dados em uma ordem sequencial para calcular a média; · A média reflete todas as pontuações – se um dado for mudado, a média também mudará; · Problema: sensível aos casos extremos – outliers – nestes casos, deve-se utilizar a mediana; · Não deve ser utilizada quando a distribuição de frequências não é normal; · Distribuição normal: curva simétrica que parece um sino – sujeitos distribuem-se normalmente em torno de um valor modal; · Quando a distribuição é assimétrica, é improvável que a média represente a maioria das pontuações – exemplo: renda mensal. · Considerações importantes sobre as MTC · A média é a MTC mais influenciada por valores extremos, entretanto é a medida mais “rica”, porque considera todos valores do conjunto de dados; · A mediana não é afetada por valores extremos; · A moda é a MTC mais “pobre”, porque considera apenas os valores mais frequentes; · Devemvir acompanhadas de alguma medida de variabilidade: amplitude e desvio-padrão – trazem informação sobre a dispersão existente no conjunto de dados – o quanto as pontuações estão distribuídas em torno do centro. · Medidas de variabilidade · Amplitude · Diferença entre a pontuação mais alta e a mais baixa – reflete pontuações mais extremas – medida bruta da variabilidade; · É a MV mais “pobre”, porque considera apenas os dois valores extremos do conjunto de dados – não fornece uma ideia global da distribuição dos valores de uma amostra. · Ex.: ao longo do dia foram registradas as seguintes temperaturas: 19, 25, 28 e 32. A amplitude é calculada: 32 - 19 = 13. · Desvio-padrão · Medida que indica o quanto os valores da amostra variam em torno da média; · Desvios = indicação do quão longe cada um dos valores está da média; · O desvio-padrão expressa a variação média do conjunto de dados em torno da média, para mais ou para menos; · Quanto maior o desvio-padrão, maior a variabilidade dos dados; · É a MV mais conhecida, sendo amplamente utilizada. · Diferenças entre grupos · Perguntas sobre diferenças entre diferentes grupos de sujeitos: mulheres X homens em relação a um determinado fenômeno, o mesmo grupo em momentos distintos (ex.: atenção); · Primeiro passo: aplica-se um teste que avalia atenção, calcula-se a média obtida por cada grupo e estas são comparadas; · Segundo passo: procedimento estatístico para estudo das diferenças entre os grupos – teste t de Student; · O teste t é um teste de hipótese que usa conceitos estatísticos para rejeitar ou não uma hipótese nula quando a estatística de teste (t) segue uma distribuição t – isto é uma distribuição de probabilidade teórica que é simétrica, campaniforme, e semelhante à curva normal padrão, porém com caudas mais largas, podendo gerar valores mais extremos que uma simulação da normal. · Terceiro passo: a diferença entre os grupos é suficientemente grande ou significativa do ponto de vista estatístico? Há chance de ter ocorrido por acaso? · Para a diferença ser estatisticamente significativa deve-se garantir que aquele dado será encontrado novamente em pelo menos 95% dos casos (numa pesquisa em condições semelhantes); · A dúvida sobre a veracidade do dado não deve ultrapassar 5% ou 0,05 – índice de significância (p). · O teste t só pode ser utilizado em amostras com distribuição normal (testes paramétricos). · Mann-Whitney e Wilcoxon são os equivalentes para amostras que não se distribuem na curva normal (testes não-paramétricos). · Em estatística o teste U de Mann-Whitney e Wilcoxon é um teste não paramétrico aplicado para duas amostras independentes. · Quando se dispõe de uma amostra pequena e a variável numérica não apresenta sabidamente uma variação normal (ou não dá para ser verificada satisfatoriamente), ou ainda, quando não há homogeneidade das variâncias, o teste t não é apropriado. · Para exemplificar uma situação onde o teste t acusaria falsamente uma associação estatisticamente significativa, imagine que em um dos dois grupos se observe um outlier (valor muito discrepante). · Em função desse único valor, em sendo muito maior do que os outros, o grupo a que ele pertence apresentará uma média elevada, o que aumentará a estatística do teste t, com um consequente p-valor associado pequeno. Nessa situação, pode-se utilizar o teste não paramétrico de Mann-Whitney. · O teste de Mann-Whitney teste foi desenvolvido primeiramente para comparar tendências centrais de duas amostras independentes de tamanhos iguais. · Na verdade, verifica-se se há evidências para acreditar que valores de um grupo A são superiores aos valores do grupo B. · Ao contrário do teste t, que testa a igualdade das médias, o teste de Mann-Whitney (U) testa a igualdade das medianas. · Os valores de U calculados pelo teste avaliam o grau de entrelaçamento dos dados dos dois grupos após a ordenação. · A maior separação dos dados em conjunto indica que as amostras são distintas, rejeitando-se a hipótese de igualdade das medianas. · Quando há mais de dois grupos a serem comparados · Utiliza-se a ANOVA – análise de variância – por exemplo: comparação de determinada habilidade entre três ou quatro faixas etárias diferentes. · Estudos de correlação · Verificam a relação entre duas variáveis · Coeficientes de correlação – varia de +1 a -1, passando pelo zero · +1 = correlação diretamente proporcional (mais-mais) · -1 = correlação inversamente proporcional (mais-menos) · 0,00 a 0,19 – sem relação ou relação desprezível; · 0,20 a 0,29 – relação fraca; · 0,30 a 0,39 – relação moderada; · 0,40 a 0,69 – relação forte; · 0,70 a 1,00 – relação muito forte. · Correlações estabelecem a relação apenas entre duas variáveis; · Eventualmente podemos investigar a correlação entre diversas coisas ao mesmo tempo – análise fatorial. · Análise fatorial · Procedimento analítico que visa a diminuição do número de variáveis; · Fator – nova variável que substitui um conjunto de outras, que têm algo em comum – itens que se relacionam entre si – dá-se um nome ao fator, para facilitar sua identificação; · Ex.: questionário com 6 questões em que três 3 questões são sobre capacidade verbal e 3 questões são de raciocínio matemático · A análise fatorial agrupa em um único fator as questões referentes a cada variável – com isso, em vez de dizer como cada item se relaciona com cada item, podemos dizer como cada item se relaciona com o grupo de itens (fator). · O objetivo da análise fatorial é determinar quantos fatores existem em quais itens se relacionam com quais fatores; · Relação item-fator – carga fatorial = número que varia de +1 a -1, passando pelo zero; · Carga fatorial de 0,30 (+ ou -) – indica que existe alguma relação entre o item e o fator.
Compartilhar