Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 MEDIDAS DE TENDÊNCIA CENTRAL, POSIÇÃO E DISPERSÃO 2 QUALITATIVA QUANTITATIVA NOMINAL ORDINAL CONTÍNUA DISCRETA peso, altura, salário, idade número de filhos, número de carros sexo, cor dos olhos classe social, grau de instrução Variável: Qualquer característica associada a uma população. Classificação das variáveis: 3 Variáveis Quantitativas MEDIDAS DE POSIÇÃO; MEDIDAS DE VARIABILIDADE OU DISPERSÃO; MEDIDAS DE ASSIMETRIA . ELEMENTOS TÍPICOS DA DISTRIBUIÇÃO DE DADOS 4 Variáveis Quantitativas - As outras medidas de posição são as SEPARATRIZES, que englobam: a própria MEDIANA, os QUARTIS e os PERCENTIS. - As mais importantes são as MEDIDAS DE TENDÊNCIA CENTRAL, pois os dados observados tendem, e geral, a se agrupar em torno de valores centrais: MÉDIA, MEDIANA E MODA. MEDIDAS DE POSIÇÃO: 5 n x n xxxx x n i i n 1321 ... •Média: Dados: 2, 5, 3, 7, 8 5 5 87352 x x – média aritmética Xi – os valores da variável n- o número de valores 6 • Mediana: A mediana é o valor da variável que ocupa a posição central de um conjunto de n dados ordenados. 2 Posição da mediana: n+1 7 Exemplos: Dados: 2, 6, 3, 7, 8 Dados ordenados: 2 3 6 7 8 n = 5 (ímpar) Posição da Mediana n+1 5+1 = 3 2 Md = (4 + 6) / 2 = 5 Dados: 4, 8, 2, 1, 9, 6 n = 6 (par) Dados ordenados: 1 2 4 6 8 9 Md 6+1 = 3,5 2 Md=6 2 8 • Moda: É o valor que ocorre com maior frequência em uma série de valores. i 1 2 3 4 5 6 7 8 9 10 11 12 Conjunto 1 18 17 14 10 14 14 17 Conjunto 2 9 8 8 14 13 10 10 11 15 7 Conjunto 3 13 6 5 3 20 16 16 12 6 4 4 Conjunto 4 41 29 30 6 10 36 17 7 21 33 16 38 unimodal bimodal multimodal amodal 9 ANÁLISE COMPARATIVA DAS MEDIDAS DE POSIÇÃO MODA VANTAGENS DESVANTAGENS Fácil de calcular. Pode estar afastada do centro dos dados. Não é afetada pelos dados extremos. Difícil de incluir em funções matemáticas. Pode ser aplicada em qualquer escala: nominal, ordinal, intervalar e razão (ou proporcional). A amostra pode ter mais de uma moda e algumas amostras podem não ter moda. Não utiliza todos os dados da amostra. MEDIANA VANTAGENS DESVANTAGENS Fácil de calcular. Difícil de incluir em funções matemáticas. Não é afetada pelos dados extremos. Não utiliza todos os dados da amostra. É um valor único. Aplicável em escalas ordinal, intervalar e razão. MÉDIA VANTAGENS DESVANTAGENS Fácil de compreender e aplicar. É afetada pelos dados extremos da amostra. Utiliza todos os dados da amostra. Requer o conhecimento de todos os dados da amostra. É um valor único. Aplicável em escalas intervalar e razão. 10 POSIÇÃO RELATIVA DA MÉDIA, MODA e MEDIANA ASSIMÉTRICA POSITIVA quando os valores de seu extremo superior estão mais afastados da MÉDIA que seus valores do extremo inferior, resultando num contorno que apresenta uma cauda mais longa na direção do extremo superior dos valores. ASSIMETRIA NEGATIVA apresenta uma cauda mais longa na direção dos valores extremos inferiores, o que afeta a MÉDIA ‘puxando-a’ também na direção dos valores extremos inferiores. simétrica 11 Separatrizes São medidas descritivas que buscam dividir os valores ordenados de uma variável em proporções essencialmente iguais Quartis São valores de uma série de dados que a dividem em 4 partes iguais min max Q2 Q3 Q1 Separatrizes Quartis São valores de uma série de dados que a dividem em 4 partes iguais min max Q2 Q3 Q1 25% 50% 75% Valor situado de tal modo na série que 25% dos dados é menor que ele e 75% dos dados são maiores Coincide com a mediana Valor situado de tal modo na série que 75% dos valores são menores que eles e 25% é maior 13 Percentis Denominamos percentis os 99 valores que separam uma série em 100 partes iguais. Indicamos P1, P2, P3,.....,P99 É evidente que P50 = Md = Q2 P25 = Q1; e P75 = Q3 14 O percentil de ordem p 100 (0 < p < 1), em um conjunto de dados de tamanho n, é o valor da variável que ocupa a posição p (n + 1) do conjunto de dados ordenados. Percentis: percentil 50 = mediana ou segundo quartil (Md) percentil 25 = primeiro quartil (Q1) percentil 75 = terceiro quartil (Q3) percentil 10 = primeiro decil Casos particulares: 15 Exemplo de uso das separatrizes: Suponha que um entomologista selecionou 50 exemplares de uma espécie de inseto, de mesma ninhada e período de eclosão dos ovos. Submeteu os insetos às mesmas condições ambientais e nutricionais, para estimar o tempo de vida (longevidade) da espécie. Ao final do experimento, o pesquisador obteve os seguintes dados de longevidade (em dias de sobrevivência para cada exemplar): 16 17 18 18 18 20 20 21 21 21 22 23 23 24 24 25 25 26 26 27 27 27 28 29 30 31 31 33 33 34 36 36 37 38 38 41 42 42 43 45 45 46 47 50 52 53 59 61 65 70 p (n + 1) Determinando-se o 1º e 3º quartis: Q1 = p25 --------- 0,25 x (51) = 12,75 (posição) ------ (23+23)/2= 23 dias Significa que 25% dos insetos tiveram um tempo de vida igual ou menor que 23 dias, e 75% período de vida igual ou maior que 23 dias. Q3 = p75 --------- 0,75 x (51) = 38,25 (posição) ------ (42+43)/2= 42,5 dias 16 Md = 3,05 Q1 = 2,05 Q3 = 4,9 Md = 5,3 Q1 = 1,7 Q3 = 12,9 Dados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 n=10 Posição de Md: 0,5(n+1)= 0,511= 5,5 Dados: 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6 n=11 Posição de Q1: 0,25 (11) = 2,75 Posição de Q3: 0,75 (11) = 8,25 Md = (3 + 3,1)/2 = 3,05 Q1=( 2+2,1)/2=2,05 Q3=(3,7+6,1)/2=4,9 17 Grupo 1: 3,4,5,6,7 Grupo 2: 1, 3, 5, 7, 9 Grupo 3: 5,5,5,5,5 Exemplo 2: Considere as notas de um teste de 3 grupos de alunos G 1 * * * * * G 2 * * * * * G 3 * * * * * 0 10 5 e md1= md2= md3 = 5 Temos: x1 = x2 = x3 = 5 _ _ _ 18 Medidas de Dispersão Finalidade: encontrar um valor que resuma a variabilidade de um conjunto de dados •Amplitude (A): A = máx - min 19 Grupo 1: 3,4,5,6,7 Grupo 2: 1, 3, 5, 7, 9 Grupo 3: 5,5,5,5,5 Exemplo 2: Considere as notas de um teste de 3 grupos de alunos G 1 * * * * * G 2 * * * * * G 3 * * * * * 0 10 5 e md1= md2= md3 = 5 Temos: x1 = x2 = x3 = 5 _ _ _ Grupo 1, A = 4 Grupo 2, A = 8 Grupo 3, A = 0 20 n i in n xx n xxxxxx sVariância 1 222 2 2 12 11 )()(...)()( VariânciaPadrãoDesvio s •Variância: •Desvio padrão: 21 G3: s2 = 0 s = 0 Cálculo para os grupos: 4 G1: s2 =(3-5)2+(4-5)2+ (5-5)2+ (6-5)2+ (7-5)2 G2: s2 = 10 s = 3,16 s = 1,58 s2 = 10/4= 2,5 22 - é uma medida de dispersão relativa - elimina o efeito da magnitude dos dados - exprime a variabilidade em relação à média %100 x s CV • Coeficiente de Variação (CV) 23 Altura 1,143m 0,063m 5,5% Peso 50 kg 6kg 12% Média DesvioPadrão Coef. de Variação Conclusão: Os alunos são, aproximadamente, duas vezes mais dispersos quanto ao peso do que quanto à altura. Altura e peso de alunos Exemplo 3: 24 Conclusão: Em relação às médias, as alturas dos adolescentes e dos recém-nascidos apresentam variabilidade quase iguais. Desvio padrão Coef. de variação Média Recém-nascidos 50 6 12% Adolescentes 160 16 10% Altura (em cm) de uma amostra de recém- nascidos e de uma amostra de adolescentes Exemplo 4:
Compartilhar