Buscar

Estatística descritiva_Medidas_2 (2)

Prévia do material em texto

Estatística descritiva
Medidas de Tendência central e dispersão
MEDIDAS
Tendência central e dispersão
2
DISTRIBUIÇÕES
Para dar sentido ao aparente caos dos resultados brutos, os investigadores começam por dar uma ordem aos dados. O primeiro passo consiste em formar uma distribuição, isto é, a disposição de qualquer conjunto de resultados por ordem de magnitude.
3
Resultados de QI
não ordenados
75
100
105
95
120
130
95
90
115
85
115
100
110
100
110
Distribuição de resultados
de QI
130
120
115
115
110
110
105
100
100
100
95
95
90
85
75
MEDIDAS
Tendência central e dispersão
4
A distribuição permite ao observador perceber as tendências gerais mais rapidamente do que seria capaz com um conjunto de resultados brutos desordenados. 
Podemos apresentá-los como uma distribuição de frequências. 
Uma distribuição de frequências é uma listagem de cada resultado, alcançado, acompanhada pelo número de indivíduos que obtiveram esse resultado.
X (Resultado bruto)
130
120
115
110
105
100
95
90
85
75
f (frequência de ocorrência)
1
1
2
2
1
3
2
1
1
1
5
EIXO DO X E EIXO DO Y
 Para além de apresentarem as distribuições de frequências sob a forma de tabelas, os estatísticos apresentam frequentemente os dados sob a forma gráfica. Um gráfico tem a vantagem de constituir uma espécie de “imagem” dos dados. 
	É habitual indicar os resultados brutos, ou valores reais da variável, no eixo horizontal, eixo dos X, chamado abcissa. A frequência de ocorrência é apresentada na vertical, ou eixo dos Y, chamado ordenada.
6
6
Histogramas e polígonos de frequências
7
Para construir um histograma, é desenhado um retângulo sobre cada resultado bruto. A altura do retângulo indica a frequência de ocorrência de cada resultado.
7
Histogramas e polígonos de frequências
8
Para construir um polígono de frequências, em vez dos rectângulos, utiliza-se um único ponto para designar a frequência de cada resultado. Estes pontos são depois unidos por uma série de linhas retas.
8
Média Aritmética
Para nos ajudar a compreender as semelhanças e as diferenças entre os indivíduos, possuímos algumas técnicas úteis para descobrir a média, ou valor típico, de uma distribuição.
Conhecer a média do QI para uma determinada turma pode ajudar-nos a planear o currículo, a decidir o nível a que devem ser ensinados alguns dos temas, ou a escolher livros na biblioteca. A informação acerca do valor típico de uma distribuição permite-nos interpretar de forma mais significativa todos os resultados da distribuição.
9
Exemplo: 3,3,3,4,15
Média (X) = 3+3+3+4+15 = 5,6
5,6
5
9
MÉDIA ARITMÉTICA
Se lhe for dado um conjunto de resultados de QI, e lhe pedirem para descobrir o valor médio, o mais provável é que calcule a média aritmética. Isto é, que some todos os resultados de QI e divida depois a soma pelo número total de resultados. 
10
X=130+120+115+115+115+110+110+105+100+100+95+95+90+85+75
15
X=1660 = 110,66
 15
Exemplo 2
Gênio: acima de 144 pontos;
Superdotado: de 130 a 144 pontos;
Acima da média: de 115 a 129 pontos;
Média alta: de 100 a 114 pontos;
Média baixa: de 85 a 99 pontos;
Abaixo da média: de 70 a 84 pontos;
Baixo: de 55 a 69 pontos;
Muito baixo: menos de 55 pontos.
A tabela com a escala de classificação é:
10
 A interpretação da média 
 
Pode, por vezes, ser enganadora, especialmente em grupos em que a própria população, ou dimensão da população, se modifiquem.
Por exemplo, a média de QI numa turma típica de “calouros” universitários é habitualmente cerca de cinco pontos mais baixa do que a média da mesma turma quando os alunos mais tarde chegam a finalistas. Será que isto indica que os alunos aumentam os seus QI á medida que frequentam a faculdade? 
X=130+120+115+115+115+110+110+105+100+100+95+95+90+85+75
15
X=1660 = 110,66
 15
Gênio: acima de 144 pontos;
Superdotado: de 130 a 144 pontos;
Acima da média: de 115 a 129 pontos;
Média alta: de 100 a 114 pontos;
Média baixa: de 85 a 99 pontos;
Abaixo da média: de 70 a 84 pontos;
Baixo: de 55 a 69 pontos;
Muito baixo: menos de 55 pontos.
A tabela com a escala de classificação é:
11
 A interpretação da média 
 
Não, 
Porque dado que a dimensão da turma de finalistas é quase sempre menor do que a dos “calouros”, as duas já não constituem uma única população. Os que têm o QI mais baixo da turma de “calouros” têm tendência a abandonar a faculdade, e a nunca chegar a finalistas.
12
EXEMPLO:
19,1717= 19,172 = 19,17
19,1618= 19,162 = 19,16
19,1565= 19,16
19,1415= 19,14
> 5 = PRÓX. INTEIRO
< 5 = NÃO ARREDONDO
= 5 = ARREDONDO OU NÃO
 REGRA DE ARREDONDAMENTO
13
A MEDIANA
Em algumas situações, no entanto, a utilização da média pode conduzir a uma imagem extremamente distorcida do valor típico de uma distribuição. Observemos a distribuição seguinte de vencimentos mensais (em escudos)
14
50 - 150 - 150 – 98 - 97 – 97- 97- 96,5 – 95 - 92, 5 – 90 – 90 - 88
Mediana de distribuição Par
Mediana de distribuição Impar
50 – 88 – 90 - 90 - 92,5 - 95 – 96,5 -97 – 97 – 97 – 98 – 150 – 150
50 – 88 – 90 - 90 - 92,5 – 95 - 95 – 96,5 -97 – 97 – 97 – 98 – 150 – 150
Mediana = 95 + 96,5 = 191,5/2 = 95,75
MEDIANA = 96,5
N 7
2
14
Se houver um número par de resultados numa distribuição, a mediana é calculada determinando o ponto que se situa exactamente a meio do caminho entre os dois valores centrais, ou seja, 114,5.
15
120
118
115 114,5 Mediana
114
114
112
____
693
 X = 115,50 Média
120
118
115 114,5 Mediana
114
114
 6
____
587
 X = 97,83 Média
Ao contrário da média, a mediana não é afectada pela presença de um resultado extremo em qualquer direção, como se pode ver no exemplo da direita.
A MEDIANA
15
A MODA
A terceira medida de tendência central é denominada moda. A moda é o resultado que ocorre com maior frequência numa distribuição. Num polígono de frequências, a moda é o ponto em que a curva atinge o seu nível mais elevado; num histograma localiza-se na barra mais alta. Algumas distribuições, designadas bimodais, têm duas modas. Distribuições deste tipo ocorrem quando os resultados se agrupam em dois locais separados, ou quando o grupo que está a ser medido se compõe possivelmente de dois subgrupos. 
16
Mo = 114
120
118
115
114
114
 6
____
587
 
16
A MODA
AMODAL
BIMODAL
17
Mo = AMODAL
EX4
120
118
115
114
114
114
 6
____
701
 
EX2
120
118
115
114
114
 6
____
587
 
EX3
120
120
118
115
114
114
 6
____
707
 
EX1
120
118
115
114
112
 6
____
585
 
Mo = 114
Mo = 114, 120
BIMODAL
Mo = 114
17
 As distribuições são classificadas de acordo com a direcção da sua “cauda”. Quando a cauda está do lado direito, diz-se que a curva tem uma assimetria positiva.; quando a “cauda” é para a esquerda, tem uma assimetria negativa. 
18
Representação gráfica de distribuições assimétricas: (a) negativamente assimétrica; (b) positivamente assimétrica.
Assimétrica a esquerda
Assimétrica a direita
Medidas de assimetria
A curva normal se classifica em curva normal simétrica e curva normal assimétrica.
X=3; x=3,5
M=4
X=5; x=4,5
M=4
18
QUARTIS
 De forma análoga à mediana, definem-se duas outras medidas estatísticas que têm, por vezes, bastante interesse para o conhecimento de uma distribuição estatística – os quartis. A separação da distribuição (ordenada) é feita em três valores: Q1, Q2 e Q3, em que o Q2 é, naturalmente, a mediana. 
 O valor (Q1) 1º Quartil, que separa os primeiros 25% dos dados ordenados por ordem crescente dos restantes 75%.
O 3º Quartil é o valor Q3 que divide a distribuição em duas partes, sendo 75% dos dados menores ou iguais a Q3 e os restantes 25% maiores ou iguais.
19
19
CÁLCULO DOS QUARTIS
20
Determinação do Q1
1º calcula-se 
2º identifica-se a classe Q1
3º aplica-se a fórmula 
3. Determinação do Q3
1º calcula-se 
2º identifica-se a classe Q3 pela Fac
3º aplica-se a fórmula 
5 5 6 7 8 9 11 12 15 16 
25%
50%
25%
25%
25%
2. Determinação do Q2=Md
1º calcula-se 
2º identifica-se a classe FAC
3º aplica-se a fórmula20
QUARTIS
 O cálculo do 1º e do 3º quartil faz-se de modo análogo ao do cálculo da mediana. Com efeito, uma vez ordenados os dados, o 1º quartil é o valor correspondente à mediana da primeira metade da distribuição e o 3º quartil é o valor mediano da segunda metade.
 
 3 7 8 8 8 9 10 10 10 11 11 11 11 11 12 13 14
21
Q1
Md
Q3
Q1=8+8/2 = 8
Q2= Md = 10
Q3= 11+11/ 2 = 11
21
DECIS
 São os valores que dividem a distribuição em 10 partes iguais
 
 3 7 8 8 8 9 10 10 10 11 11 11 11 11 12 13 14
22
1º calcula-se 
2º identifica-se a classe Di pela Fac
3º aplica-se a fórmula 
22
PERCENTIS
 São os valores que dividem a distribuição em 100 partes iguais
 
 3 7 8 8 8 9 10 10 10 11 11 11 11 11 12 13 14
23
1º calcula-se 
2º identifica-se a classe Di pela Fac
3º aplica-se a fórmula 
P1
P100
1%
4%
100%
P50
50%
Dados agrupados
P10= 
P90= 
23
PERCENTIS
 São os valores que dividem a distribuição em 100 partes iguais
 
 3 7 8 8 8 9 10 10 10 11 11 11 11 11 12 13 14
24
1º calcula-se 
2º identifica-se a classe Di pela Fac
3º aplica-se a fórmula 
Dados agrupados
24
25
Esta medida se define pelo grau de achatamento da curva
Medidas de curtose
25
Exercício
 As classificações obtidas por um aluno ao longo do ano letivo foram as seguintes:
8 11 15 16 7 12 5 6 9 5
1. Determine a classificação mediana, modal e os quartis
2. Determine a amplitude.
3. Supondo que a média mínima exigida para aprovação nesta disciplina é de 10 valores, qual a situação final deste aluno? Justifique. 
26
26
VARIABILIDADE
 Do mesmo modo que as medidas de tendência central nos dão informações acerca da semelhança existente entre as medições, as medidas de variabilidade informam-nos acerca de como os resultados diferem ou variam. As medidas de variabilidade são cruciais em educação, uma vez que nos dão informação vital acerca de um dos temas fundamentais da Psico-pedagogia – as diferenças individuais.
27
27
A AMPLITUDE
 Uma forma de descrever a variabilidade em qualquer distribuição de resultados é calcular a amplitude (A).
 A amplitude é a diferença entre o resultado mais elevado e o resultado mais baixo, e constitui uma medida da extensão total da distribuição. 
 A amplitude é representada por um único valor. 
 Por exemplo, se o resultado mais alto numa distribuição de QI for 140 e o resultado mais baixo for 60, então A é igual a 80. 
28
28
DESVIO-PADRÃO
 O DESVIO-PADRÃO (DP): Representa a essência do conceito de variabilidade. Embora a amplitude seja importante, ao dar algum significado a um conjunto de resultados, tem uma limitação bastante significativa: baseia-se em apenas dois resultados, o mais elevado e o mais baixo. O desvio-padrão, pelo contrário, toma em consideração todos os resultados existentes na distribuição. Por conseguinte, o desvio-padrão é uma medida de variabilidade que indica o grau em que todos os valores de uma distribuição se desviam da média. 
29
29
DESVIO PADRÃO
Quanto maior for o valor numérico do DP, mais os valores se distanciam da média. Quanto mais pequeno o valor do DP, menos os resultados se distanciam da média, agrupando-se mais estreitamente à sua volta.
 Uma distribuição com um desvio-padrão baixo diz-nos que o grupo que está a ser medido é homogéneo enquanto uma distribuição com um desvio-padrão elevado descreve um grupo heterogéneo de resultados. O desvio-padrão, ou desvio típico, é sempre expresso por um único valor.
 Para se calcular o DP, seguem-se os seguintes passos:
30
30
X X²
15 225 X = ∑X/N = 72/8 = 9,00
12 144
10 100 DP = 
 9 81
 9 81 DP = 3,535 = 3,54
 8 64
 7 49
 2 4
__ ___
72 748
31
CÁLCULO DA VARIÂNCIA (X²)
(2-9,0)²+ (7-9)²+( 8-9)²+ (9-9)²+ (9-9)²+ (10-9)²+ (12-9)²+ (15-9)²
8
49+ 4+1+ 0+ 0+ 1+ 9+ 36
8
100 = 12,5
 8
CÁLCULO DO DESVIO PADRÃO (DP)
31
Some os X´s para obter ∑X
Divida por N para obter X
Eleve ao quadrado cada X para obter X²
Some esses quadrados para obter ∑X²
Divida o valor de ∑X² por N e subtraia o quadrado da média, X².
Extraia a raiz quadrada para obter o DP
32
32
PROPRIEDADES DA MÉDIA, MEDIANA, MODA, VARIÂNCIA E DP 
MÉDIA: 
BEM DEFINIDA, FÁCILMENTE INTERPRETÁVEL E FÁCIL DE CALCULAR 
PRESTA-SE BEM A TRATAMENTOS ALGÉBRICOS
PÕES EM JOGO OS VALORES DE TODOS OS DADOS
MUITO INFLUENCIADA PELOS DADOS EXTREMOS
MEDIANA:
BEM DEFINIDA, FÁCIL DE INTERPRETAR E DE DETERMINAR
NÃO É INFLUENCIADA PELOS CASOS EXTREMOS OU ABERRANTES
NÃO SE CALCULA TENDO EM CONTA TODOS OS DADOS
NÃO SE PRESTA AO TRATAMENTO ALGÉBRICO
33
33
Propriedades (Cont.)
MODA:
FÁCIL DE INTERPRETAR E FÁCIL DE DETERMINAR
NÃO É INFLUENCIADA PELOS EXTREMOS
PODE PÔR EM EVIDÊNCIA A HETEROGENEIDADE DUM GRUPO
NÃO TEM EM CONTA TODOS OS DADOS
NÃO SE PRESTA A TRATAMENTO ALGÉBRICO
VARIÂNCIA (Média dos quadrados dos desvios)
É UMA BOA MEDIDA DE DISPERSÃO
É SEMPRE POSITIVA
NÃO TEM A MESMA UNIDADE QUE OS DADOS
DESVIO PADRÃO
UMA DAS MAIS USADAS MEDIADS DE DISPERSÃO
É SEMPRE POSITIVA
TEM A MESMA UNIDADE QUE OS DADOS
34
34

Continue navegando