Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 MEDIDAS DESCRITIVAS DE POSIÇÃO, TENDÊNCIA CENTRAL E VARIABILIDADE 2 3 Estatística descritiva (Exploratória) PRIMEIRO PASSO: Tabelas (distribuição de frequência) e Gráficos. SEGUNDO PASSO: Cálculo de medidas descritivas. Um número que resume toda a informação da distribuição do conjunto de dados. Ex. Tendência central, posição, variabilidade, assimetria e curtose. OBS: Assim como no primeiro passo, a medida descritiva a ser utilizada depende do tipo da variável aleatória. 4 Medidas de Tendência Central e Posição Moda(mo): É o valor (ou atributo) que ocorre com maior freqüência.Moda Ex (em Kg): 4, 5, 4, 6, 5, 8, 4 e 4 Mo = 4 Kg 5 Mediana A mediana é o valor da variável que ocupa a posição central de um conjunto ordenado de n dados. Posição da mediana: (n+1)/2 Ex 1 (em m): 2, 5, 3, 7 e 8 Dados ord.: 2,3,5,7e 8 =>Pos= (5+1)/2=3 => Md = 5 m Ex 2 (em m): 3, 5, 2, 1, 8 e 6 Dados ordenados:1,2,3,5,6,8 =>Pos = (6+1)/2=3,5 => Md=(3+5)/2=4 m 6 Quantis O quantil de ordem p, em um conjunto de dados de tamanho n, é o valor da variável que ocupa a posição px(n+1) do conjunto ordenado de dados. Casos Particulares: Quantil 0,25= primeiro quartil (Q1) Quantil 0,5= mediana (md) ou segundo quartil Quantil 0,75= terceiro quartil (Q3) Interpretações: md: 50% dos valores do conjunto de dados estão abaixo da mediana. Q1: 25% dos valores estão abaixo de Q1. 7 Exemplos Ex(1): 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 e 7,7 =>n=10 Posição de Q1: 0,25(11)=2,75 => Q1=(2+2,1)/2 = 2,05 Kg Posição Md: 0,5x11=5,5 => Md=(3+3,1)/2 = 3,05 Kg Posição de Q3: 0,75(11)=8,25 => Q3=(3,7+6,1)/2= 4,9 Kg Ex(2):0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6 =>n=11 Md=5,3 Kg Q1=1,7 Kg Q3=12,9 Kg 8 Média Aritmética Simples nn x n i i n xxxxx 1321 ... Ex (em Kg):2, 5, 3, 7 e 8 Média = (2+5+3+7+8)/5 = 5 Kg É o ponto de equilíbrio de uma distribuição de dados. 9 Exemplo 2: Considere as notas de um teste de 3 grupos de alunos (valores são pontos): Grupo 1: 3, 4, 5, 6, 7; Grupo 2: 1, 3, 5, 7,9; e Grupo 3: 5,5,5,5,5. G1 0 10 0 10 0 10 5 G2 G3 55x :Temos 331331 MdMdMdxx 10 Medidas de Variabilidade (ou Dispersão) Finalidade: Encontrar um valor que resuma a variabilidade (dispersão) de um conjunto de dados Interpretação: Quanto maior o valor da medida maior é a variabilidade do conjunto de dados, ou seja, mais heterogêneo é o conjunto e, vice-versa. Medidas: Amplitude, intervalo interquartílico, variância, desvio padrão e coeficiente de variação. 11 AMPLITUDE (R) Definido como sendo a diferença entre o maior e o menor valor de um conjunto de dados. R = Valor máximo – Valor mínimo Para os grupos anteriores, temos: Grupo 1 R = 4 pontos Grupo 2 R = 8 pontos Grupo 3 R = 0 pontos 12 Intervalo-Interquartil (d) É a diferença entre o terceiro quartil e o primeiro quartil, ou seja, d= Q3 - Q1 Ex. 1(em kg): 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 Q1=2,05 e Q3=4,9 d = Q3 - Q1 = 4,9 - 2,05 = 2,85 kg 13 Desvio padrão amostral (S) VariânciaPadrão Desvio 1 / 1 2 11 2 1 2 2 n n n xx S n i i n i i n i i xx 14 Cálculo da variância para o grupo 1: G1: 3, 4, 5, 6 e 7: Vimos que: 2 22222 2 5,2 4 10 15 )57()56()55()54()53( pontosS 5x Desvio padrão pontosS 58,15,2 15 Coeficiente de Variação (CV) É uma medida de dispersão relativa; Elimina o efeito da magnitude dos dados; Exprime a variabilidade em relação a média %100 X S CV 16 Exemplo 4: Altura e peso de alunos Conclusão: Os alunos são, aproximadamente, duas vezes mais dispersos quanto ao peso do que quanto a altura Média Desvio padrão Coeficiente de variação Altura 1,143m 0,063m 5,5% Peso 50Kg 6kg 12% 17 Exemplo 3: Alturas de meninos de uma amostra e altura de homens adultos de outra amostra. Média Desvio padrão Coeficiente de variação Meninos 50cm 6cm 12% Homens 160cm 16cm 10% Conclusão: Em relação ‘as médias, as alturas dos homens e dos meninos apresentam variabilidade quase iguais. 18 Variáveis Qualitativas nominais MEDIDAS DE POSIÇÃO E TENDÊNCIA CENTRAL: Moda. MEDIDAS DE DISPERSÃO: Não faz sentido e, portanto, não existem. 19 Variáveis Qualitativas ordinais MEDIDAS DE POSIÇÃO E TENDÊNCIA CENTRAL: Moda, Mediana e Quartis. MEDIDAS DE DISPERSÃO: Amplitude e Intervalo-Interquartil 20 Variáveis Quantitativas (Discretas e Contínuas) MEDIDAS DE POSIÇÃO E TENDÊNCIA CENTRAL: Todas as disponíveis, por exemplo, Moda, Média, Mediana e Quartis. MEDIDAS DE DISPERSÃO: Todas as disponíveis, por exemplo, Amplitude, Intervalo-Interquartil, Variância, Desvio Padrão, Coeficiente de Variação. 21 Boxplot O BOXPLOT representa os dados através de um retângulo construído com os quartis e fornece informações sobre a forma da distribuição da variável (tendência central, variabilidade e assimetria) e sobre valores extremos. 22 Exemplo de construção de um Boxplot. Com a finalidade de aumentar o peso (em Kg) um regime alimentar foi aplicado em 12 pessoas. Os resultados (ordenados) foram: -0,7 2,5 3,0 3,6 4,6 5,3 5,9 6,0 6,2 6,3 7,8 11,2. Calculando as medidas temos: Mediana (md ou Q2) = 5,6kg 1º.quartil (Q1) = 3,3kg 3º.quartil (Q3) = 6,25kg d=intervalo interquartil = Q3-Q1 =2,95kg Logo as linhas auxiliares correspondem aos pontos: Q1-1,5d = -1,25kg Q3+1,5d = 10,675kg 23 Exemplo de de um Boxplot. Ganho de peso (em Kg) em um regime alimentar aplicado em 12 pessoas (dados anteriores) Interpretação. A distribuição do ganho de peso (em Kg) é ligeiramente assimétrica a esquerda e apresenta um outlier.
Compartilhar