Baixe o app para aproveitar ainda mais
Prévia do material em texto
3. CARACTERÍSTICAS DAS DISTRIBUIÇÕES DE FREQÜÊNCIAS MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL Utilizando essas medidas podemos localizar o valor representativo do qual os dados tendem a agrupar-se, com maior ou menor freqüência. Isto é, se a concentração de dados se localiza no início, no meio, ou no final da distribuição, ou ainda, se há uma distribuição por igual dos dados. Média Aritmética ( X ) É a mais importante das medidas de posição, além de ser um conceito muito familiar. Quando se fala, por exemplo, em altura média de um grupo de pessoas, ou da temperatura média numa cidade em determinado dia, ou da nota média de uma turma de alunos de estatística, etc, estamos tratando simplesmente de média aritmética. • Média Aritmética para Dados Não Agrupados: sejam x1, x2, x3,...,xn, portanto, n valores da variável X. Então: ∑∑∑∑==== ==== n 1i ix n 1X • Média Aritmética para Dados Agrupados: sendo assim, usaremos a média aritmética dos valores x1, x2, x3,...,xn, ponderados pelas respectivas freqüências absolutas (F1, F2, F3,...,Fn). Então: i k 1i i Fx n 1X ∑= = No caso em que a tabela é divida em classes, usaremos como os “Xi’s”, os pontos médios de cada classes. Mediana ( x~ ou Med ) Colocando os valores em ordem crescente, mediana é o elemento que ocupa a posição central, ou seja, divide o conjunto de valores deixando 50% deles abaixo do seu valor e 50% acima. • Mediana para Dados Não Agrupados: para a série 5, 7, 8, 10 e 14, a mediana será 8. Indica-se x~ = Med = 8. Para a série 5, 7, 8, 10, 15, 17, a mediana será (8+10)/2, ou seja, x~ = 9. Percebemos que precisamos considerar dois casos: � n par: sendo assim a mediana será o valor que ocupa a posição entre 2 n e .1 2 n + � n ímpar: neste caso, a mediana será o valor que ocupa a posição 2 1n + . • Mediana para Dados Agrupados em classes: 1o PASSO: calcule 2 n , como a variável aleatória é contínua não se preocupe se n é par ou ímpar. 2o PASSO: pela freqüência acumulada identifica-se a classe que contém a mediana. 3o PASSO: utiliza-se a fórmula: 2 . i med med n F x l c F − = + ∑ ɶ Em que: Lmed é o limite inferior da classe da mediana; ∑ iF é a soma das freqüências anteriores a classe da mediana; Fmed é a freqüência absoluta da classe da mediana. c é a amplitude da classe da mediana. 3.1.3 Separatrizes 3.1.3.1 Quartis Os quartis dividem um conjunto de dados em 4 partes iguais. Assim: Q1: é o primeiro quartil, e deixa 25% dos dados abaixo de seu valor; Q2: é o segundo quartil, e deixa 50% dos dados abaixo de seu valor (coincide com a mediana) Q3: é o terceiro quartil, e deixa 75% dos dados abaixo de seu valor. Os quartis são dados por: 1 1 1 4 . i Q Q n F Q l c F − = + ∑ ; 2 2 2 2 . i Q Q n F Q l c F − = + ∑ ; 3 3 3 3 4 . i Q Q n F Q l c F − = + ∑ 3.1.3.2 Percentis São medidas que dividem a série em 100 partes iguais. Assim: Em que: 100 . i i i i P P in F P l c F − = + ∑ Moda (Mo) Denominamos moda o valor que ocorre com maior freqüência em uma série de valores. Obs: Quando todos os dados aparecem uma única vez (ou seja Fi=1 para todo Xi da amostra) dizemos que o conjunto é amodal; Quando dois valores ocorrem com freqüência máxima dizemos que o conjunto é bimodal. Se mais de dois valores ocorrem com frequência máxima dizemos que multimodal. Para dados agrupados em classes usamos a seguinte fórmula: 1 1 2 . oo M M l c∆= + ∆ + ∆ Onde: ∆1 é a diferença entre a freqüência da classe modal e a imediatamente anterior. ∆2 é a diferença entre a freqüência da classe modal e a imediatamente posterior. h é a amplitude da classe modal. Características da Média, Mediana e Moda A média é uma medida mais estável do que a mediana e a moda. A média é preferível às demais medidas, para estimar a tendência central, quando se trata de muitas classes de populações, por haver menos variabilidade entre as médias calculadas a partir de várias amostras aleatórias. Pode ser calculada a partir dos dados brutos, sem recorrer a qualquer tipo de agrupamento ou ordenação, o que não ocorre com a mediana e a moda. É utilizada para medir a variabilidade da amostra. Em distribuições de freqüências onde ocorram classe com limites indefinidos a não há dificuldades para determinar mediana e a moda, todavia a média não pode ser determinada com exatidão. A mediana é preferível a média quando se está interessado em conhecer exatamente o ponto médio da distribuição, aquele valor que distribui em duas partes iguais, e ainda, quando os dados extremos são tais que possam afetar sensivelmente a média. A moda é utilizada essencialmente quando pretendemos uma medida rápida e aproximada da tendência central. (não levando em consideração a variabilidade da amostra). A média é afetada pelos extremos (xmax e xmin). A moda e a mediana não são afetadas pelos extremos. MEDIDAS DE DISPERSÃO Quase nunca uma única medida é suficiente para descrever de modo satisfatório um conjunto de dados. Tomemos como exemplo o caso da média aritmética, que é uma medida de posição, largamente empregada, e consideremos os dois conjuntos de observações: A: {24 25 25 26 27 29} e B: {15 17 25 28 35 36} Ambos têm a mesma média, 26. No entanto, percebe-se intuitivamente que o conjunto B acusa dispersão muito maior do que o conjunto A. Torna-se então necessário estabelecer medidas que indiquem o grau de dispersão, ou variabilidade, em relação ao valor central. Amplitude Total A amplitude total é a diferença entre o maior e o menor dos valores da série, ou seja: A = xmáx − xmín Esta é uma medida de dispersão muito limitada, pois depende apenas dos valores externos, não sendo afetada pela dispersão dos valores internos. Desvio Médio Mede o grau de dispersão ou o grau de concentração dos valores em torno da média. ∑ = −= k i iiM FXx n D 1 . 1 Variância Neste caso considera-se o quadrado de cada (xi - X ). ∑ − − = = k 1i i 2 i 2 F.)Xx( 1n 1S Desvio Padrão É a raiz quadrada da variância. S = 2S Coeficiente de Variação É útil para a comparação em termos relativos do grau de concentração em torno da média de séries de dados distintas. X SCV = OBS: Quando os dados estão agrupados em classes, usamos a média de cada classe para Xi. Medida de Assimetria � Coeficiente de Pearson 13 13 S QQ X2QQ A − −+ = Se < > = negativaaassimétricéãodistribuiçaA positivaaassimétricéãodistribuiçaA siméticaéãodistribuiçaA S S S 0 0 0 Medida de Curtose É o grau de achatamento de uma distribuição. Para medir o grau de curtose utilizaremos: )PP(2 QQ K 1090 13 − − = Se < > = caleptocúrtiécurvaa,263,0K caplaticúrtiécurvaa,263,0K amesocúrticécurvaa,263,0K Características do Desvio Padrão Quando o desvio padrão representar uma descrição da amostra , o denominador é n – 1, a razão deste procedimento reside que no fato, que utilizando o denominador n-1 obtém uma melhor estimativa para o parâmetro da população (será estudado no Capítulo de Estimação), além disto n-1 dos desvios são independentes determinando o n-ésimo desvio. Para n muito grande os divisoresn-1 e n não alteram o resultado. Propriedades do Desvio-padrão P1 – Somando (subtraindo) um valor constante arbitrário, x0, a cada elemento do conjunto, o desvio-padrão não se altera. P2 - Multiplicando ou dividindo um valor constante arbitrário, c, a cada elemento do conjunto, o desvio-padrão fica multiplicado ou dividido pela constante. P3 – O desvio-padrão é maior desvio médio. Interpretação do Desvio Padrão I1 - Sejam duas amostras onde 21 xx = e S1> S2 . Então podemos afirmar a primeira amostra apresenta maior variabilidade dos dados em relação a segunda.
Compartilhar