Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística aplicada à testagem Prof. Leonardo C. Guimarães Estatística aplicada à testagem Conteúdos: ● Tipos de Estatística ● Amostras e Populações ● Medidas de tendência central (posição) ● Medidas de variabilidade ● Técnicas gráficas para descrever os dados ● Distribuição normal ● Estatística aplicada à testagem ● O que é a estatística? Um ramo da matemática ● Para que serve? Organizar, representar, resumir, analisar e manipular de outras formas os dados numéricos. TOMADA DE DECISÕES Estatística aplicada à testagem ESTATÍSTICA: ● MEDIDAS DERIVADAS DE DADOS DE AMOSTRAS PARÂMETROS: ● MEDIDAS DERIVADAS DE DADOS DE POPULAÇÕES TIPOS DE ESTATÍSTICA ESTATÍSTICA DESCRITIVA ● Descreve, condensa ou representa um conjunto de dados de uma AMOSTRA. ESTATÍSTICA INFERENCIAL ● Estima valores POPULACIONAIS baseados em valores de amostras ou para testar HIPÓTESES. ESTATÍSTICA DESCRITIVA Dados podem ser representados de duas formas: GRÁFICOS TABELAS (NÚMEROS) GRÁFICO TABELAS (NÚMEROS) AMOSTRA (n) E POPULAÇÃO (N) AMOSTRA (n) E POPULAÇÃO (N) Mas qual a diferença entre elas? População: consiste em um conjunto de indivíduos que compartilham de, pelo menos, uma característica comum, seja ela cidadania, filiação a uma associação de voluntários, etnia, matrícula na universidade, etc. Amostra: é uma seleção de elementos de uma população. Amostragem: é processo de escolha dos indivíduos que pertencem a uma amostra. AMOSTRA (n) E POPULAÇÃO (N) Fenômenos humanos ● População ○ Muita extensa ○ Nunca temos acesso à população inteira ○ Muitas variáveis ● Amostras ○ São mais baratas ○ Mais acessível Como escolher uma amostra? ● Conhecer bem a população que se quer estudar; ● Assegurar-se de que a amostra é a mais representativo possível da população; ● Problema de amostragem ○ Viés do pesquisador (tendenciosidade); ○ Elementos na amostra que não representam a população. AMOSTRA (n) E POPULAÇÃO (N) PARÂMETROS Usa-se, por vezes, a Estatística como um bêbado usa um poste de luz: mais para apoio do que para iluminação. MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) Medidas de tendência central (posição) ● Formas mais comuns de estatística descritiva. ● Fornece uma indicação do escore típico de um conjunto de dados. ● 3 principais medidas de tendência central ○ Média (aritmética) ○ Mediana ○ Moda Como sabemos qual delas utilizar? MÉDIA (X) ● Soma de todos os valores da amostra, dividida pelo número total de valores. ● Representa um resumo dos dados ● Valor hipotético ● Pode ser calculado para qualquer conjunto de dados; ● “Centro de gravidade” ● Não é necessariamente o ponto médio de uma distribuição ● O uso da média está restrito exclusivamente com dados intervalares e de razão. MÉDIA (X) Quando deve escolhida? ● Valores reais da amostra ● Observar que pode dar uma boa indicação do valor típico da amostra Restrição: ● Sensível a valores extremos: 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 20 1 2 3 4 5 6 7 8 9 100 Média = 5,5 Média = 6,5 Média = 14,5 MODA (Mo) ● A moda é facilmente encontrada por simples inspeção ● É simplesmente o valor mais repetido em um conjunto de dados; ● 1 2 3 1 1 6 5 4 1 4 4 3 ● Qual é a moda? ● Mo=1 ● É a única medida de tendência central para variáveis de nível nominal (escala nominal) MODA (Mo) Você acredita em Deus Nível de Fé Sim Alto Sim Baixo Não Médio Sim Não tenho Não Alto Não Não tenho Sim Alto Sim Alto Não Médio Mo=Sim Mo= Alto Mediana (Mdn) ● Valor que está no meio da amostra. ● Pode ser determinada por inspeção ou por fórmula. ● Apresenta o mesmo número de valores acima e abaixo dela (50%-50%). ● Ordenação de todos os valores em ordem de magnitude crescente ou decrescente. ● Esta medida não é sensível a valores extremos. Mediana (Mdn) ● Trabalha tanto com dados ordinais quando intervalares ● Fórmula para conjunto ímpar de elementos ● Posição da mediana = (N+1)/2 ● Ex: 11 12 13 16 17 20 25 => (7+1)/2=4 ● O resultado desta fórmula indica que o valor da mediana está na 4ª posição na ordenação dos dados. Mdn = 16 Como saber qual destas medidas de tendência central utilizar? ● Nível de mensuração ○ Intervalar => Moda, Mediana e Média ○ Nominal => Moda ○ Ordinal => Moda e Mediana ● Forma de distribuição dos dados ● Unimodal simétrica (curva normal) => Moda, Mediana e Média ● Unimodal assimétrica => Mediana ● Bimodal => Moda ● Objetivo da pesquisa ○ Medida descritiva rápida e simples => Moda ○ Precisão para distribuição assimétrica => Mediana ○ Precisão para distribuição simétrica => Média MEDIDAS DE VARIABILIDADE Medidas de Variabilidade (dispersão) ● Estas estatísticas descrevem quanta dispersão existe em um conjunto de dados. ● Quando somadas às informações das medidas de tendências centrais, as medidas de variabilidade nos ajudam a localizar qualquer valor dentro de uma distribuição e a melhorar a descrição de um conjunto de dados. Medidas de Variabilidade (dispersão) ● Elas medem a dispersão dos dados em relação a um referencial (geralmente a média). ● Basicamente diz se os dados estão bem aglutinados (homogêneos), com valores próximos entre si, ou bem dispersos, com valores muito diferentes entre si (heterogêneos). ● As mais importantes medidas de dispersão são: amplitude, variância e desvio-padrão Medidas de Variabilidade ● Nos mostra quanta variação existe em uma amostra. ● Ex: 2 amostras de 50 alunos X=1,65m Valores dispersos Valores concentrados Amplitude ● Simples indicação da dispersão dos valores de uma população ou amostra. ● Calculada através da diferença entre o valor máximo e o valor mínimo do conjunto de dados. AT=X(máximo) – X(mínimo) ● Fornece apenas informação sobre a variação nos extremos do conjunto de dados. ● Não oferece informação do que acontece no interior do conjunto Amplitude Variância ● A variabilidade é algo intrínseca a qualquer medida. ● Essa variabilidade é medida em relação à média do grupo e da distância de cada valor individual em relação a essa média. ● Do conjunto de cada um desses valores das distâncias (desvios da média) calculamos a média dos desvios. Desvio-padrão ● Desvio é a distância de um escore arbitrário em relação à média de um conjunto de dados. ● Encontra-se o desvio subtraindo a média de qualquer escore bruto (Xi – X). ● É mais informativo sobre o que acontece dentro do conjunto de valores. ● Ele mostra o quanto os valores do conjunto variam (estão distantes) da média. Desvio-padrão ● O que ele significa? ● O que se pode dizer de uma distribuição a partir do desvio padrão? ● Quanto maior a variabilidade em torno da média de uma distribuição, maior é o desvio padrão. ● Ajuda a descobrir como os valores se concentram ou se afastam do valor da média. ● O desvio padrão só pode ser trabalhado com variáveis de nível intervalar (contínuas/discretas). Desvio-padrão ● O desvio-padrão é a raiz quadrada da variância e o que usamos quando olhamos para a média das nossas amostras. Variância e desvio-padrão ● Ex: ● Calcule a variância do seguinte conjunto de dados, obtidos em um teste sobre aprendizagem. Considere a média X = 6,443. Xi Xi - X (Xi – X)² 5,0 -1,4429 2,0818 5,7 -0,7429 0,5518 5,8 -0,6429 0,4133 6,1 -0,3429 0,1176 6,2 -0,2429 0,0590 6,3 -0,1429 0,0204 6,4 -0,0429 0,0018 6,5 0,0571 0,0033 6,6 0,1571 0,0247 6,7 0,2571 0,0661 6,8 0,3571 0,1276 7,1 0,6571 0,4318 7,2 0,7571 0,5733 7,8 1,3571 1,8418 ∑ 0,0000 6,3143 S²= ∑(Xi-X)² n-1 S²= 6,3143 14-1 S²= 6,3143 13 S²= 0,4857 Por que é preciso elevar as diferenças ao quadrado? Para se eliminar os valores negativos, cuja soma será sempre ZERO! média= 6,443 s = √s² s²= 0,4857 s = √0,4857 s = 0,6969 X X - X (X – X)² 5,0 -1,4429 2,0818 5,7 -0,7429 0,5518 5,8 -0,6429 0,4133 6,1 -0,3429 0,1176 6,2 -0,2429 0,0590 6,3 -0,1429 0,0204 6,4 -0,0429 0,0018 6,5 0,0571 0,0033 6,6 0,1571 0,0247 6,7 0,2571 0,0661 6,80,3571 0,1276 7,1 0,6571 0,4318 7,2 0,7571 0,5733 7,8 1,3571 1,8418 ∑ 0,0000 6,3143 Por que precisamos fazer a raiz quadrada ao calcular o desvio padrão? Porque precisamos utilizar a mesma unidade de medida padrão. Ex. Kg²> Kg; Anos² > Anos Quartis São medidas de dispersão utilizadas em distribuições não normais (não paramétricas). Em uma distribuição não normal, a referência de centro deixa de ser a média e passa a ser a mediana. Com os quartis dividimos o conjunto de dados ordenados (rol) em quatro partes iguais, daí o nome quartil. Cada quartil representa 25% dos valores do conjunto de dados: Q1=25%; Q2=50% (mediana); Q3=75% e Q4=100% Quartis Quartis Quartis Quartis MODELO DA CURVA NORMAL Distribuição Normal (simétrica) ● É muito importante saber como os dados se distribuem. ● O tipo de distribuição direciona a escolha do teste estatístico mais adequado. Distribuição Normal (simétrica) A POPULAÇÃO DEVE SER SIMÉTRICA EM TORNO DA MÉDIA AS CAUDAS ENCONTRAM O EIXO X NO INFINITO MÉDIA, MODA E MEDIANA COINCIDEM A POPULAÇÃO DEVE TER A FORMA DE SINO BILATERALMENTE SIMÉTRICA Distribuição Normal (simétrica) Distribuição Normal (simétrica) ● Curtose: grau de achatamento ou afunilamento da distribuição ● Platicúrtica: achatada (-) ● Leptocúrtica: afunilada (+) ● Mesocúrtica: normal (0) Distribuição Normal (simétrica) Curtose Distribuição Normal (simétrica) Distribuição Normal (simétrica) Distribuição Normal (simétrica) POR QUE A CURVA NORMAL É TÃO IMPORTANTE NA TESTAGEM PSICOLÓGICA? Distribuição Normal PORQUE, O modelo da curva normal é usado descritivamente para localizar a posição de escores derivados de distribuições normais. Também é usada para se fazer distribuições que não são normais, mas que se aproximam do normal, conforme o modelo de testagem. Distribuição Normal PORQUE, O modelo da curva normal se aplica inferencialmente nas áreas de: (a) fidedignidade, para derivar intervalos de confiança que avaliem escores obtidos e as diferenças entre eles; e (b) validade, para derivar intervalos de confiança para predições ou estimativas baseadas em escores de testes. DISTRIBUIÇÃO NÃO-NORMAL Distribuição não-normal (assimétrica) NEM SEMPRE A DISTRIBUIÇÃO DOS DADOS SERÁ NORMAL ISSO PODE SER DECORRENTE DO ERRO AMOSTRAL/PADRÃO Distribuição não-normal (assimétrica) Distribuição não-normal (assimétrica) ● Assimétrica negativa, quando a média é menor que a moda ● Assimétrica positiva, quando a média for maior que a moda Distribuição não-normal (assimétrica) − ASSIMETRIA POSITIVA: ● CAUDA MAIOR PARA A DIREITA. Distribuição não-normal (assimétrica) − ASSIMETRIA NEGATIVA: ● CAUDA MAIOR PARA ESQUERDA Distribuição não-normal (assimétrica) Na assimetria não é recomendado se usar a média como medida de tendências central. Distribuição não-normal (assimétrica) ASSIMETRIA NEGATIVA SIMÉTRICA ASSIMETRIA POSITIVA
Compartilhar