Buscar

03- Estatística aplicada à testagem (slides)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 62 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 62 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 62 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Estatística aplicada à 
testagem
Prof. Leonardo C. Guimarães
Estatística aplicada à testagem
Conteúdos:
● Tipos de Estatística
● Amostras e Populações
● Medidas de tendência central (posição)
● Medidas de variabilidade
● Técnicas gráficas para descrever os dados
● Distribuição normal
●
Estatística aplicada à testagem
● O que é a estatística?
Um ramo da matemática
● Para que serve?
Organizar, representar, resumir, analisar e manipular de 
outras formas os dados numéricos.
TOMADA DE DECISÕES
Estatística aplicada à testagem
ESTATÍSTICA:
● MEDIDAS DERIVADAS DE DADOS DE AMOSTRAS
PARÂMETROS:
● MEDIDAS DERIVADAS DE DADOS DE POPULAÇÕES
TIPOS DE ESTATÍSTICA
ESTATÍSTICA DESCRITIVA
● Descreve, condensa ou representa um conjunto de 
dados de uma AMOSTRA.
ESTATÍSTICA INFERENCIAL
● Estima valores POPULACIONAIS baseados em valores 
de amostras ou para testar HIPÓTESES.
ESTATÍSTICA DESCRITIVA
Dados podem ser representados de duas formas:
GRÁFICOS
TABELAS (NÚMEROS)
GRÁFICO
TABELAS (NÚMEROS)
AMOSTRA (n) E POPULAÇÃO (N)
AMOSTRA (n) E POPULAÇÃO (N)
Mas qual a diferença entre elas?
População: consiste em um conjunto de indivíduos que compartilham 
de, pelo menos, uma característica comum, seja ela cidadania, filiação 
a uma associação de voluntários, etnia, matrícula na universidade, etc.
Amostra: é uma seleção de elementos de uma população. 
Amostragem: é processo de escolha dos indivíduos que pertencem a 
uma amostra.
AMOSTRA (n) E POPULAÇÃO (N)
Fenômenos humanos
● População 
○ Muita extensa
○ Nunca temos acesso à 
população inteira
○ Muitas variáveis
● Amostras 
○ São mais baratas
○ Mais acessível
Como escolher uma amostra?
● Conhecer bem a população 
que se quer estudar;
● Assegurar-se de que a 
amostra é a mais 
representativo possível da 
população;
● Problema de amostragem
○ Viés do pesquisador 
(tendenciosidade);
○ Elementos na amostra 
que não representam a 
população.
AMOSTRA (n) E POPULAÇÃO (N)
PARÂMETROS
Usa-se, por vezes, a Estatística 
como um bêbado usa um poste de 
luz: mais para apoio do que para 
iluminação.
MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO)
Medidas de tendência central (posição)
● Formas mais comuns de estatística descritiva.
● Fornece uma indicação do escore típico de um 
conjunto de dados.
● 3 principais medidas de tendência central
○ Média (aritmética)
○ Mediana
○ Moda 
Como sabemos 
qual delas utilizar?
MÉDIA (X)
● Soma de todos os valores da amostra, dividida pelo número total de 
valores. 
● Representa um resumo dos dados
● Valor hipotético 
● Pode ser calculado para qualquer conjunto de dados;
● “Centro de gravidade”
● Não é necessariamente o ponto médio de uma distribuição
● O uso da média está restrito exclusivamente com dados intervalares 
e de razão.
MÉDIA (X)
Quando deve escolhida?
● Valores reais da amostra
● Observar que pode dar uma boa indicação do valor típico da amostra
Restrição:
● Sensível a valores extremos:
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 20
1 2 3 4 5 6 7 8 9 100
Média = 5,5
Média = 6,5
Média = 14,5
MODA (Mo)
● A moda é facilmente encontrada por simples inspeção
● É simplesmente o valor mais repetido em um 
conjunto de dados;
● 1 2 3 1 1 6 5 4 1 4 4 3
● Qual é a moda?
● Mo=1
● É a única medida de tendência central para variáveis de 
nível nominal (escala nominal)
MODA (Mo)
Você acredita em Deus Nível de Fé
Sim Alto
Sim Baixo
Não Médio
Sim Não tenho
Não Alto
Não Não tenho
Sim Alto
Sim Alto
Não Médio
Mo=Sim
Mo= Alto
Mediana (Mdn)
● Valor que está no meio da amostra.
● Pode ser determinada por inspeção ou por fórmula. 
● Apresenta o mesmo número de valores acima e abaixo 
dela (50%-50%).
● Ordenação de todos os valores em ordem de 
magnitude crescente ou decrescente.
● Esta medida não é sensível a valores extremos.
Mediana (Mdn)
● Trabalha tanto com dados ordinais quando 
intervalares
● Fórmula para conjunto ímpar de elementos
● Posição da mediana = (N+1)/2
● Ex: 11 12 13 16 17 20 25 => (7+1)/2=4
● O resultado desta fórmula indica que o valor da 
mediana está na 4ª posição na ordenação dos dados. 
Mdn = 16
Como saber qual destas medidas de tendência central utilizar?
● Nível de mensuração
○ Intervalar => Moda, Mediana e Média
○ Nominal => Moda
○ Ordinal => Moda e Mediana
● Forma de distribuição dos dados
● Unimodal simétrica (curva normal) => Moda, Mediana e Média
● Unimodal assimétrica => Mediana
● Bimodal => Moda
● Objetivo da pesquisa
○ Medida descritiva rápida e simples => Moda
○ Precisão para distribuição assimétrica => Mediana
○ Precisão para distribuição simétrica => Média
MEDIDAS DE VARIABILIDADE
Medidas de Variabilidade (dispersão)
● Estas estatísticas descrevem quanta dispersão existe 
em um conjunto de dados.
● Quando somadas às informações das medidas de 
tendências centrais, as medidas de variabilidade nos 
ajudam a localizar qualquer valor dentro de uma 
distribuição e a melhorar a descrição de um conjunto 
de dados.
Medidas de Variabilidade (dispersão)
● Elas medem a dispersão dos dados em relação a um 
referencial (geralmente a média).
● Basicamente diz se os dados estão bem aglutinados 
(homogêneos), com valores próximos entre si, ou bem 
dispersos, com valores muito diferentes entre si 
(heterogêneos).
● As mais importantes medidas de dispersão são: 
amplitude, variância e desvio-padrão 
Medidas de Variabilidade
● Nos mostra quanta variação existe em uma amostra.
● Ex: 2 amostras de 50 alunos X=1,65m
Valores dispersos
Valores concentrados
Amplitude
● Simples indicação da dispersão dos valores de uma população ou 
amostra.
● Calculada através da diferença entre o valor máximo e o valor mínimo do 
conjunto de dados.
AT=X(máximo) – X(mínimo)
● Fornece apenas informação sobre a variação nos extremos do conjunto 
de dados.
● Não oferece informação do que acontece no interior do conjunto
Amplitude
Variância
● A variabilidade é algo intrínseca a qualquer medida. 
● Essa variabilidade é medida em relação à média do grupo e da distância 
de cada valor individual em relação a essa média.
● Do conjunto de cada um desses valores das distâncias (desvios da média) 
calculamos a média dos desvios.
Desvio-padrão
● Desvio é a distância de um escore arbitrário em relação à média 
de um conjunto de dados.
● Encontra-se o desvio subtraindo a média de qualquer escore 
bruto (Xi – X).
● É mais informativo sobre o que acontece dentro do conjunto de 
valores.
● Ele mostra o quanto os valores do conjunto variam (estão 
distantes) da média.
Desvio-padrão
● O que ele significa?
● O que se pode dizer de uma distribuição a partir do desvio padrão?
● Quanto maior a variabilidade em torno da média de uma distribuição, 
maior é o desvio padrão.
● Ajuda a descobrir como os valores se concentram ou se afastam do 
valor da média.
● O desvio padrão só pode ser trabalhado com variáveis de nível 
intervalar (contínuas/discretas).
Desvio-padrão
● O desvio-padrão é a raiz quadrada da variância e o que usamos 
quando olhamos para a média das nossas amostras.
Variância e desvio-padrão
● Ex:
● Calcule a variância do seguinte conjunto de dados, 
obtidos em um teste sobre aprendizagem. Considere a 
média X = 6,443.
Xi Xi - X (Xi – X)²
5,0 -1,4429 2,0818
5,7 -0,7429 0,5518
5,8 -0,6429 0,4133
6,1 -0,3429 0,1176
6,2 -0,2429 0,0590
6,3 -0,1429 0,0204
6,4 -0,0429 0,0018
6,5 0,0571 0,0033
6,6 0,1571 0,0247
6,7 0,2571 0,0661
6,8 0,3571 0,1276
7,1 0,6571 0,4318
7,2 0,7571 0,5733
7,8 1,3571 1,8418
∑ 0,0000 6,3143
S²= ∑(Xi-X)²
 n-1 
S²= 6,3143
 14-1 
S²= 6,3143
 13
S²= 0,4857
Por que é preciso 
elevar as diferenças 
ao quadrado?
Para se eliminar os 
valores negativos, 
cuja soma será 
sempre ZERO!
média= 6,443
s = √s² 
s²= 0,4857
s = √0,4857 
s = 0,6969 
X X - X (X – X)²
5,0 -1,4429 2,0818
5,7 -0,7429 0,5518
5,8 -0,6429 0,4133
6,1 -0,3429 0,1176
6,2 -0,2429 0,0590
6,3 -0,1429 0,0204
6,4 -0,0429 0,0018
6,5 0,0571 0,0033
6,6 0,1571 0,0247
6,7 0,2571 0,0661
6,80,3571 0,1276
7,1 0,6571 0,4318
7,2 0,7571 0,5733
7,8 1,3571 1,8418
∑ 0,0000 6,3143
Por que precisamos 
fazer a raiz quadrada 
ao calcular o desvio 
padrão?
Porque precisamos 
utilizar a mesma 
unidade de medida 
padrão. Ex. Kg²> Kg; 
Anos² > Anos
Quartis
São medidas de dispersão utilizadas em distribuições não normais (não 
paramétricas).
Em uma distribuição não normal, a referência de centro deixa de ser a média 
e passa a ser a mediana.
Com os quartis dividimos o conjunto de dados ordenados (rol) em quatro 
partes iguais, daí o nome quartil.
Cada quartil representa 25% dos valores do conjunto de dados: 
Q1=25%; Q2=50% (mediana); Q3=75% e Q4=100%
Quartis
Quartis
Quartis
Quartis
MODELO DA CURVA NORMAL
Distribuição Normal (simétrica)
● É muito importante saber como os dados se 
distribuem.
● O tipo de distribuição direciona a escolha do teste 
estatístico mais adequado.
Distribuição Normal (simétrica)
A POPULAÇÃO DEVE SER SIMÉTRICA EM TORNO DA MÉDIA
AS CAUDAS ENCONTRAM O EIXO X NO INFINITO
MÉDIA, MODA E MEDIANA COINCIDEM
A POPULAÇÃO DEVE TER A FORMA DE SINO
BILATERALMENTE SIMÉTRICA
Distribuição Normal (simétrica)
Distribuição Normal (simétrica)
● Curtose: grau de achatamento ou afunilamento da 
distribuição
● Platicúrtica: achatada (-)
● Leptocúrtica: afunilada (+)
● Mesocúrtica: normal (0)
Distribuição Normal (simétrica)
Curtose
Distribuição Normal (simétrica)
Distribuição Normal (simétrica)
Distribuição Normal (simétrica)
POR QUE A CURVA NORMAL É TÃO IMPORTANTE NA 
TESTAGEM PSICOLÓGICA?
Distribuição Normal
PORQUE,
O modelo da curva normal é usado descritivamente 
para localizar a posição de escores derivados de 
distribuições normais. Também é usada para se 
fazer distribuições que não são normais, mas que 
se aproximam do normal, conforme o modelo de 
testagem.
Distribuição Normal
PORQUE,
O modelo da curva normal se aplica 
inferencialmente nas áreas de: (a) fidedignidade, 
para derivar intervalos de confiança que avaliem 
escores obtidos e as diferenças entre eles; e (b) 
validade, para derivar intervalos de confiança 
para predições ou estimativas baseadas em 
escores de testes.
DISTRIBUIÇÃO NÃO-NORMAL
Distribuição não-normal (assimétrica)
NEM SEMPRE A DISTRIBUIÇÃO DOS DADOS SERÁ NORMAL
ISSO PODE SER DECORRENTE DO ERRO 
AMOSTRAL/PADRÃO
Distribuição não-normal (assimétrica)
Distribuição não-normal (assimétrica)
● Assimétrica negativa, quando a média é menor que a 
moda
● Assimétrica positiva, quando a média for maior que a 
moda
Distribuição não-normal (assimétrica)
− ASSIMETRIA POSITIVA:
● CAUDA MAIOR PARA 
A DIREITA.
Distribuição não-normal (assimétrica)
− ASSIMETRIA NEGATIVA:
● CAUDA MAIOR 
PARA ESQUERDA
Distribuição não-normal (assimétrica)
Na assimetria não é recomendado se usar a 
média como medida de tendências central.
Distribuição não-normal (assimétrica)
ASSIMETRIA NEGATIVA SIMÉTRICA ASSIMETRIA POSITIVA

Outros materiais