Baixe o app para aproveitar ainda mais
Prévia do material em texto
Resumos Thalita Araújo Medidas de dispersão média de 22 anos Anos: 23, 17, 2, 3,38 , 8, 65. 7 pessoas média de 22 anos Ao apresentar medidas de tendencia central, deve-se fornecer uma medida de variabilidade ou dispersão. TENDENCIA CENTRAL + DISPERSÃO > Acompanhadas porque nem sempre a média retrata bem os dados. São 5 medidas de dispersão: amplitude, variância, desvio-padrão, erro-padrão, coeficiente de variação. Amplitude A amplitude de um conjunto de dados, definida com a diferença entre o máximo e o mínimo, é uma medida de dispersão. AMPLITUDE=MÁXIMO-MÍNIMO - A amplitude não mede muito bem a variabilidade, pois para calculá-la usam-se apenas os dois valores extremos. - Alguns autores fornecem os valores mínimos e máximos para descrever seus dados e não fornecem a amplitude. - A amplitude é muito sensível a valores discrepantes. Fazendo com que a amplitude varie bastante. Variância e Desvio-padrão - DADOS ISOLADOS O desvio padrão é uma medida de variabilidade muito recomendada porque mede muito bem a dispersão dos dados. 1° CALCULAR A VARIÂNCIA: Calcule os desvios de cada observação em relação à média. DESVIO = OBSERVAÇÃO – MÉDIA Se os desvios forem pequenos, os dados estão aglomerados em torno da média; logo, a variabilidade é pequena. Por outro lado, desvios grandes significam observações dispersas em torno da média e, portanto, variabilidade grande. EX: (3;6;5;7;9) Calcular primeiro a média. Depois o desvio. cálculo dos desvios. Existem desvios positivos e negativos. A soma dos desvios negativos é sempre igual à soma dos positivos. Nesse caso o resultado foi: 0. 2° ELEVE CADA DESVIO AO QUADRADO cálculo da variância É preciso eliminar os sinais antes de somar os desvios obtidos elevando ao quadrado. 3° SOMA DOS QUADRADOS : 20 4° DIVIDIR O RESULTADO POR n - 1 ( n é o numero de observações) 20 > soma dos desvios 4 > n-1 5 > variância Observação (x) Desvio (X - Ẋ) 3 3 – 6= -3 6 6 – 6 = 0 5 5 – 6 = -1 7 7 – 6 = 1 9 9 – 6 = 3 Demografia e bioestatística a média descreve muito bem no primeiro caso, mas não no segundo. Quanto menor a variabilidade melhor ela descreve. Quadrado do desvio (X - Ẋ) ² (-3)² = 9 0² = 0 (-1)² = 1 1² = 1 3² = 9 S² = 20 = 5 4 Resumos Thalita Araújo Desvio padrão é a raiz quadrada da variância, com sinal positivo. O cálculo da variância envolve quadrados de desvios ↓ A unidade de medida da variância é igual ao quadrado da medida das observações. ↓ não tem sentido prático Quanto maior a variância, maior o correspondente desvio padrão. DADOS AGRUPADOS processo breve Variância (dados agrupados) processo longo Processo longo ex: X (cm) / ni / Xi / Xini • usa-se o somatório dos resultados obtidos em ni e Xini e divide. X = Xini/ni Variância e desvio padrão (dados agrupados) X (cm) / ni / Xi / (X-Ẋ)=xi / xi² / xi²ni • usa-se o somatório dos resultados obtidos em ni e xi²ni e divide Variância: S²=xi²ni/ni Desvio-padrão: S=√resultado da variância Processo breve Formula: Resolve primeiro o que esta em parêntese ( ) . Na tabela: X (cm) / ni / di / dini / di²ni • usa-se o somatório dos resultados obtidos em ni, dini e di²ni. O resultado é a variância. Desvio-padrão: S=√resultado da variância. ERRO-PADRÃO O erro-padrão é obtido dividindo-se o desvio-padrão pela raiz quadrada do tamanho da população ou amostra. para a população para a amostras no ex: COEFICIENTE DE VARIAÇÃO O coeficiente de variação fornece a variação dos dados em relação à média. mais homogêneos serão os dados . Menor CV menor dispersão em torno da média para a população para amostras Um CV pode ser considerado baixo, indicando um conjunto de dados razoavelmente homogêneo, quando for < do que 30% • medida de dispersão relativa: Demografia e bioestatística Resumos Thalita Araújo CV=DESVIO/MÉDIAx100 no ex: QUARTIS Os quartis dividem um conjunto de dados em 4 partes iguais, para dividir precisa de 3 quartis. 1º 2º 3º • de forma crescente 1 corresponde 25% do primeiros dados 2 corresponde a mediana, onde 50% dos dados 3 corresponde a 75% dos dados Depois tome o conjunto de dados à esquerda da mediana; o primeiro quartil é a mediana do novo conjunto de dados. essa nova mediana sera o primeiro quartil. Tome o conjunto de dados à direita dessa mediana; o terceiro quartil é a mediana do novo conjunto de dados. a mediana para esse conjunto de dados será o terceiro quartil. fórmula para o calculo do quartil, decil e percentil n: é o tamanho da amostra Após encontrar o valor ex 5,5 levando a fazer a mediana dos valores encontrados na 5 e 6 posição. BOXPLOT OU DIAGRAMA DE CAIXA Normalmente os quartis são descritos graficamente em forma de boxplot, esses gráficos são bastantes uteis uma vez que permitem avaliar a simetria e a distribuição de dados, que permite uma perspectiva visual bastante interessante na presença ou não de dados discrepantes. Valores de dentro dessa região serão considerados comuns e os valores fora serão discrepantes. O valor do meio quer dizer que os valores estão concentrados naquela região, nesse caso a distribuição é simétrica em torno da mediana. O boxplot fornece informações importantes tanto a respeito da variabilidade quanto da assimetria do conjunto de dados, que diz muito a cerca do comportamento desse conjunto de dados. Se a amplitude for muito maior doque a distancia interquartilica e a mediana estiver mais próxima do 1 quartil do que do 3 quartil = fortes indicações de simetria positiva e de grande dispersão das observações. Demografia e bioestatística
Compartilhar