Baixe o app para aproveitar ainda mais
Prévia do material em texto
MEDIDAS DE TENDÊNCIA CENTRAL São assim denominadas porque tendem a ocupar o centro de um conjunto de dados ordenados. Também são denominadas medidas de posição. A sua aplicação está na descrição dos dados tratados. Quando usadas como medidas descritiva de uma população são chamadas parâmetros populacionais, quando usadas para dados amostrais recebem o nome de estatísticas amostrais. As medidas de tendência central mais conhecidas são: a média aritmética, a média geométrica, a mediana e a moda. As outras medidas de posição são as separatrizes: a própria mediana, os quartis, os decis e os percentis. MÉDIA ARITMÉTICA Média Aritmética para dados simples É definida como a razão entre a soma dos valores do conjunto e o número de elementos do mesmo. __ __ X = ( xi ou X = ( xi n ( fi Exemplo; Calcular a média aritmética dos elementos do conjunto (2, 4, 5, 5, 8 ) __ X = 2 + 4 + 5 + 5 + 8 = 4,8 5 PROPRIEDADES DA MÉDIA ARITMÉTICA Se uma constante k é somada a todos os elementos do conjunto, então a média aritmética do mesmo também será somada a k. Exemplo: no conjunto ( 2, 4, 5, 5, 8 ) a média aritmética é 4,8. Tomando k = 3, o conjunto fica (5, 7, 8, 8, 11). A média aritmética fica 7,8. Se todos os elementos do conjunto são multiplicados por uma constante k, então a média aritmética do mesmo é multiplicada pela mesma constante. Exemplo: Multiplicando-se k = 2, o conjunto do exemplo anterior fica ( 4, 8,10,10,16). A média aritmética fica 9,6. A soma dos desvios dos valores de um conjunto em relação à sua média aritmética é nula. Exemplo: Tomando o mesmo conjunto, ( 2, 4, 5, 5, 8 ), cuja média é 4,8, a soma dos desvios é 2 - 4,8 = -2,8 4 - 4,8 = -0,8 5 – 4,8 = 0,2 5 - 4,8 = 0,2 8 – 4,8 = 3,2 ____ 0 Média Aritmética para dados agrupados Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando por variável o número de filhos do sexo masculino. Número de meninos fi 0 2 1 6 2 10 3 12 4 4 ( = 34 Neste caso, como as freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, calculando-se a média aritmética ponderada pela fórmula; _ X = ( xifi (fi Número de meninos fi xifi 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 ( = 34 ( = 78 Temos, então: ( xifi = 78 e (fi = 34 Logo:_ X = (xifi = 78 = 2,3 (fi 34 Onde: a média aritmética é 2,3 meninos.como a variável menino é discreta, entende-se que o maior número de famílias tem 2 meninos e 2 meninas, porém com uma tendência geral de uma leve superioridade numérica em relação ao número de meninos. Para dados agrupados com intervalos de classe, temos, segundo o exemplo: i Estatura (cm) fi 1 150 | --- 154 4 2 154 | --- 158 9 3 158 | --- 162 11 4 162 | --- 166 8 5 166 | --- 170 5 6 170 | --- 174 3 ( = 40 Pela mesma razão do caso anterior, vamos, inicialmente, abrir uma coluna para os pontos médios e outra para os produtos xifi: i Estatura (cm) fi xi xifi 1 150 | --- 154 4 152 608 2 154 | --- 158 9 156 1.404 3 158 | --- 162 11 160 1.760 4 162 | --- 166 8 164 1.312 5 166 | --- 170 5 168 840 6 170 | --- 174 3 172 516 ( = 40 ( =6.440 ( xifi = 6.440, (fi = 40 e (xifi / (fi temos X = 6.440 / 40 = 161 cm Processo Breve Com o intuito de eliminarmos o grande número de cálculos e às vezes grandes algarismos gerados por algumas variáveis, empregamos o que denominamos processo breve baseado em uma mudança da variável x por outra y, tal que: yi = xi – xo h onde xo é uma variável arbitrária escolhida convenientemente dentre os pontos médios da distribuição – de preferência o de maior freqüência. Fazendo essa mudança de variável, de acordo com as propriedades relativas à média, resulta da fórmula modificada: __ X = xo + ((yifi) x h (fi Para o cálculo da média do exemplo da distribuição anterior pelo processo breve completamos a tabela dada com as colunas correspondentes aos pontos médios (xi), aos valores da nova variável (yi) e aos produtos yifi. I Estatura (cm) fi xi yi yifi 1 150 |--- 154 4 152 -2 -8 2 154 |--- 158 9 156 -1 -9 -17 3 158 |--- 162 11 160 0 0 4 162 |--- 166 8 164 1 8 5 166 |--- 170 5 168 2 10 27 6 170 |--- 174 3 172 3 9 ( = 40 ( = 10 Temos, então, xo = 160, (yifi = 10, (fi =40 e h= 4 Substituindo esses valores na fórmula: __ X = 160 + 10 x 4 = 160 + 1 = 161 cm 40 Resumindo: Abrimos uma coluna para os valores de xi. Escolhemos um dos pontos médios (o de maior freqüência) para o valor de xo Abrimos uma coluna para os valores de yi e escrevemos zero na linha correspondente à classe onde se encontra o valor de xo; a seqüência -1, - 2, -3,... logo acima do zero e a seqüência 1, 2, 3,... logo abaixo. Abrimos uma coluna para os valores do produto yifi, conservando os sinais + ou -, e, em seguida, somamos algebricamente esses produtos. Aplicamos a fórmula. MODA (Mo) Denominamos moda o valor que ocorre com maior freqüência em uma série de valores. Dados não-agrupados Quando lidamos com valores não agrupados, a moda é facilmente reconhecida; basta procurar o valor que mais se repete após a ordenação dos mesmos. Exemplo 1) Para o conjunto (7,8,9,10,10,10,11,12,13,13,15) a moda é igual a 10. Exemplo 2) Para o conjunto ( 1,5,6,7,9,10,11,12) a moda não existe. Exemplo 3) Para o conjunto ( 3,4,4,4,5,6,7,7,7,8,9) há duas modas; Mo1=4 e Mo2=7 (bimodal) OBS: A moda é o elemento com maior freqüência simples, e não o número de ocorrências deste elemento. Dados agrupados Sem intervalos de classe Uma vez agrupados os dados, é possível determinar imediatamente a moda bastando fixar o valor da variável de maior freqüência. Dado a seguinte distribuição: Número de meninos fi 0 2 1 6 2 10 3 12 4 4 ( = 34 Neste caso a freqüência máxima (12) corresponde o valor 3 da variável. Logo: Mo = 3 meninos Com intervalos de classe A classe que apresenta a maior freqüência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. Mo = l + L onde: l é o limite inferior da classe modal L é o limite superior da classe modal Dado a distribuição: i Estatura (cm) fi 1 150 | --- 154 4 2 154 | --- 158 9 3 158 | --- 162 11 4 162 | --- 166 8 5 166 | --- 170 5 6 170 | --- 174 3 ( = 40 Temos que a classe modal i = 3, l = 158 e L = 162 Mo = 158 + 162 = 320 = 160 logoMo = 160 cm ou seja o ponto médio da 2 2 classe modal. Há para o cálculo da moda outros métodos mais elaborados, como, por exemplo, o que faz uso da fórmula de Czuber: Mo = l + D1 x h D1 + D2 onde: D1 = f – f(ant) sendo: l é limite inferior da classe modal h é a amplitude da classe modal D2 = f – f(pos) f a freqüência simples da classe modal f(ant) a freqüência simples da classe anterior a classe modal f(post) a freqüência simples da classe posterior à classe modal Assim para a distribuição anterior temos: D1 = 11 – 9 = 2 e D2 = 11 – 8 = 3 Aplicando a fórmula de Czuber: Mo=158+ 2 x 4 = 158 + 2 x 4 =158 + 8 =158 + 1,6 = 159,6 logo Mo = 159,6cm 2 + 3 5 5 MEDIANA (Md) A mediana é definida como o número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem, separando o conjunto em dois subconjuntos de mesmo número de elementos. Dados não-agrupados Dada uma série de valores, como por exemplo: Ex 1) 5, 13, 10, 2, 18, 15, 6, 16, 9; o primeiro passo a ser dado é ordenar os valores em ordem crescente: 2, 5, 6, 9, 10, 13, 15, 16, 18 em seguida, toma-se por valor central o que apresenta o mesmo número de elementos à direita e à esquerda, 10, apresentando este quatro elementos acima dele e quatro abaixo. Temos então Md = 10 Se porém, a série dada tiver um número par de elementos, a mediana será qualquer dos números compreendidos entre os dois valores centrais da série, convencionando-se utilizar o ponto médio. Assim a série de valores; Ex2) 2, 6, 7, 10, 12, 13, 18, 21 tem para mediana a média aritmética entre 10 e 12 Md = 10 + 12 = 22 = 11 donde Md = 11 2 2 Verificamos que, estando ordenados os valores de uma série e sendo n o número de elementos da série, o valor mediano será: -o termo de ordem n+1, se n for ímpar; 2 -a média aritmética dos termos de ordem n e n + 1, se n for par. 2 2 Podemos comprovar tal fato nas séries dadas: -para n=9, exemplo 1), temos 9+1 = 5. Logo, a mediana é o quinto termo da série, 2 isto é: Md = 10 -para n=8, exemplo 2), temos 8 = 4 e 8 + 1 = 5. Logo, a mediana é a média 2 2 aritmética do quarto e quinto termos da série, isto é: Md = 10+12 = 22 = 11 2 2 logo: Md = 11 Obs.: - O valor da mediana pode coincidir ou não com um elemento da série, como vimos. Quando o número de elementos da série é ímpar, há coincidência. O mesmo não acontece, porém, quando esse número é par. - A mediana e a média aritmética não têm, necessariamente, o mesmo valor. Na primeira série apresentada, por exemplo, temos: __ X = 10,4 e Md = 10 - A mediana, como vimos, depende da posição e não dos valores dos elementos na série ordenada. Essa é uma das diferenças marcantes entre a mediana e a média (que se deixa influenciar, e muito, pelos valores extremos). Esta propriedade da mediana pode ser constatada através dos exemplos a seguir: _ 5, 7, 10, 13, 15 => X = 10 e Md = 10 __ 5, 7, 10, 13, 65 => X = 20 e Md = 10 isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores extremos, ao passo que a mediana permanece a mesma. Dados agrupados Se os dados se agrupam em uma distribuição de freqüência, o cálculo da mediana se processa de modo muito semelhante dos dados não agrupados, implicando, porém, a determinação prévia das freqüências acumuladas. Tem-se que determinar um valor tal que divida a distribuição em dois grupos que contenham o mesmo número de elementos; usando-se ( fi / 2 Dados agrupados sem intervalos de classe Neste caso, é o bastante identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada. Número de meninos fi Fi 0 2 2 1 6 8 2 10 18 3 12 30 4 4 34 ( = 34 Sendo (fi = 34 = 17 a menor freqüência acumulada que supera esse 2 2 valor é 18, que corresponde ao valor 2 da variável, sendo este o valor mediano. Logo, Md = 2 meninos. No caso de existir uma freqüência acumulada (Fi), tal que: Fi = ( fi / 2 a mediana será dada por Md = (xi +( xi+1))/ 2, isto é, a mediana será a média aritmética entre o valor da variável correspondente a essa freqüência acumulada e o seguinte. Com intervalos de classe Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana. Devemos para isso determinar inicialmente a classe na qual se acha a mediana – classe mediana. Tal classe será aquela correspondente à freqüência acumulada imediatamente superior a (fi / 2 . Feito isto, um problema de interpolação resolve a questão, admitindo-se, agora, que os valores se distribuam uniformemente em todo o intervalo de classe. Tomando por exemplo a distribuição i Estatura (cm) fi Fi 1 150 |--- 154 4 4 2 154 |--- 158 9 13 3 158 |--- 162 11 24 4 162 |--- 166 8 32 5 166 |--- 170 5 38 6 170 |--- 174 3 40 ( = 40 Temos: (fi = 40 = 20 2 2 Como há 24 valores incluídos nas três primeiras classes da distribuição e como pretendemos determinar o valor que ocupa o 20 lugar, a partir do início da série, vemos que este deve estar localizado na terceira classe ( i= 3), supondo que as freqüências dessa classe estejam uniformemente distribuídas. Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar, a partir do limite inferior, a distância: 20 – 13 x 4 = 7 x 4 11 11 e a mediana será dada por: Md = 158 + 7 x 4 = 158 + 28 = 158 + 2,54 = 160, 5411 11 Logo: Md = 160, 54 cm Na prática, executamos os seguintes passos; Determinamos as freqüências acumuladas Calculamos : (fi / 2 Marcamos a classe correspondente à freqüência acumulada imediatamente superior à (fi / 2 - classe mediana - e em seguida, empregamos a fórmula: Md = l + (((fi / 2) – F(ant)) h F Na qual: l é o limite da classe mediana F(ant) é a freqüência acumulada da classe anterior à classe mediana f é a freqüência simples da classe mediana h é a amplitude do intervalo da classe mediana Tomando por exemplo a distribuição anterior, temos: (fi = 40 = 20 2 Logo, a classe mediana é a de ordem 3. Então: I = 158, F(ant) = 13, f = 11 e h = 4 Substituindo estes valores na fórmula, temos: Md = 158 + (20 – 13) 4 = 158 + 28 = 158 + 2,54 = 160,54 cm 11 OBS No caso de existir uma freqüência acumulada igual a (fi / 2, a mediana será o limite superior da classe correspondente, ou seja estará na classe seguinte sendo o seu limite inferior o resultado. UTILIZAÇÃO DAS MEDIDAS DE TENDÊNCIA CENTRAL Média Artimética É a medida de tendência central mais utilizada pela simplicidade e rapidez de seu cálculo. É empregada: quando se deseja obter um valor médio estável e significativo que inclue no seu cálculo todos os valores. É de grande utilidade pela sua significância, como parâmetro, nas teorias da amostragem e da estimação estatística, é usada na construção de índices de grande importância estatística como o desvio padrão, o coeficiente de variação e o escore reduzido z, quando uma distribuição estatística apresenta assimetria e se deseja o seu centro de gravidade, que será representado pela média aritmética, quando se deseja maior precisão na determinação de uma medida, realizam-se várias medições e toma-se como resultado a média aritmética de uma delas. Em razão da primeira propriedade da média aritmética, os erros para mais e para menos se anulam e a média aritmética será o valor mais próximo da medida real, a média aritmética pode ser calculada a partir dos valores brutos, sem recorrer a qualquer agrupamento ou ordenação. Moda É a menos usada, sendo empregada principalmente: quando se deseja conhecer apenas o valor mais freqüente, quando se deseja ter uma noção imediata e aproximada de qual será o valor da tendência central. em distribuições de freqüência onde ocorram classes com limites indefinidos ( “menos de .... “ou “ mais de...”). em casos como este, o valor da média aritmética não pode ser determinado com exatidão. Mediana É usada quando: quando se deseja encontrar o valor exato que divide a distribuição em duas metades, quando os valores extremos são tais que podem afetar sensivelmente o valor da média aritmética, em distribuições onde ocorram limites superiores ou inferiores aberto (“menos de ... “ ou “mais de ... “). SEPARATRIZES Assim, como a mediana, que divide uma distribuição em duas partes iguais, existem medidas estatísticas que dividem a mesma distribuição em quatro, dez, ou cem partes iguais. O cálculo de tais medidas é semelhante, operacionalmente, ao cálculo da mediana. QUARTIS Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Por analogia à fórmula da mediana para determinar os quartis usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana, (fi / 2 por: K(fi / 4 onde k é o número de ordem do quartil. Assim, temos: Q1 = Ii + ((fi / 4 - F(ant)) h f Q3 = Ii+ (3(fi / 4 - F(ant)) h f Dada a seguinte distribuição de freqüência I Estatura (cm) fi Fi 1 150 |--- 154 4 4 2 154 |--- 158 9 13 3 158 |--- 162 11 24 4 162 |--- 166 8 32 5 166 |--- 170 5 38 6 170 |--- 174 3 40 ( = 40 Primeiro quartil Terceiro quartil ((fi / 4 = 40 / 4 = 10 ( i = 2 3(fi / 4 = (3 . 40) /4 = 30 ( i = 4 Q1 = 154 + ( 10 – 4 ) . 4 = 154 + 24 Q3 = 162 + (30 – 24) . 4 = 162 + 24 9 9 8 8 Q1 = 154 + 2,66 = 156,7 cm Q3 = 162 + 3 = 165,0 cm DECIS Denominamos decis os 9 valores que separam uma série em 10 partes iguais. Por analogia à fórmula da mediana para determinar os decis usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana, (fi / 2 por: K(fi / 10 onde k é o número de ordem do decil. Assim, temos no exemplo acima : Primeiro decil Quarto decil ((fi / 10 = 40 / 10 = 4 ( i = 2 4(fi / 10 = (4 . 40) /10 = 16 ( i = 3 D1 = 154 + ( 4 – 4 ) . 4 = 154 +0 D4 = 158 + (16 – 13) . 4 = 158 + 12 9 11 11 D1 = 154 cm D4 = 158 + 1,1 = 159,1 cm Por analogia resolvem-se os outros decis PERCENTIS Denominamos percentis os 99 valores que separam uma série em 100 partes iguais. Por analogia à fórmula da mediana para determinar os percentis usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana, (fi / 2 por: K(fi / 100 onde k é o número de ordem do percentil. Assim, temos no exemplo acima : Primeiro percentil Vigésimo percentil ((fi / 100 = 40 / 100 =0,4 ( i = 1 20(fi / 100 = (20 . 40) /100 = 8 ( i = 2 P1 = 150 + ( 0,4 – 0 ) . 4 = 150 + 0,4 P20 = 154 + (8 – 4) . 4 = 154 + 16 4 9 9 P1 = 150,4 cm P20= 154 + 1,8 = 155,8 cm Por analogia resolvem-se os outros percentis. EQUIVALÊNCIAS As seguintes equivalências são válidas: P50 = D5 = Q2 = Md P25 = Q1 P75 = Q3 P10 = D1 P20 = D2 ... P90 = D9 Assim, para qualquer das medidas relacionadas acima, basta calcular o equivalente percentil. Na prática, ao se estudar um conjunto de dados é comum considerar apenas os valores compreendidos entre o décimo percentil e o nonagésimo percentil. Este procedimento visa excluir dos estudos os valores extremos, garantindo desta forma maior precisão para a descrição dos dados. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE A dispersão de um conjunto de dados pode ser entendida como a variação dos mesmos em torno de um valor central. Na Estatística este valor central é a Média Aritmética. Em situações que exigem o emprego de ferramentas estatísticas a dispersão é utilizada para avaliar a homogeneidade de um conjunto de dados de observação. Supondo que se deseja comparar a performance de dois grupos, com base em um teste de matemática básica. Grupo A: 70, 71, 69, 70, 70 Grupo B: 60, 80, 70, 62, 83 Calculando a média aritmética para cada grupo, vamos obter: _ __ Xa = 70 Xb = 71 Baseado nestes resultados, diríamos que a performance do grupo B é um pouco melhor que a do grupo A. Mas, observando mais detalhadamente os dados, notamos que as notas do grupo A variam apenas de 69 a 71, ao passo que as do grupo B variam de 60 a 83,o que revela que a performance de A é bem mais uniforme do que a de B. Para avaliar quantitativamente o grau de variabilidade ou dispersão dos valores de um conjunto de números em torno de valor médio, lançaremos mão das estatísticas denominadas de medidas de dispersão. As principais são: a amplitude total, a variância, o desvio padrão e o coeficiente de variação. AMPLITUDE TOTAL A amplitude é a diferença entre o maior e o menor valor observado. Para os exemplos acima teremos: Grupo A: A = 71 – 69 = 2 Grupo B: A = 83 – 60 = 23 Suponhamos outro grupo ( C ): 63, 40, 50, 50,60 onde A = 63 – 40 = 23 Notamos que os grupos B e C representam a mesma amplitude, apesar dos conjuntos de valores serem bem diferentes. Dessa forma, verificamos que a amplitude total tem o grave inconveniente de ser influenciada apenas pelos valores extremos do conjunto, desprezando os valores intermediários. Assim, a amplitude não fornece uma idéia precisa quanto à dispersão do conjunto como um todo. VARIÂNCIA (S2, (2) A variância de um conjunto de n valores: x1, x2, ...., xn é a média aritmética dos quadrados dos desvios desses valores em relação à sua média. _ 2 _ 2 (2 = ( (xi –x) ou (2 = ( (xi –x) (fi n Esta fórmula deve ser utilizada para calcular a variância de uma população, no caso de amostras devemos substituir o denominador n por n-1 . Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação a unidade em questão; para contornar o problema da unidade define-se o desvio padrão. DESVIO PADRÃO (() O desvio padrão é definido como a raiz quadrada positiva da variância. __________________ ( = ( ((xi2 ) / n – (( xi / n )2 Para o desvio padrão são válidas as seguintes propriedades: 1)- somando-se (ou subtraindo-se) uma constante a todos os valores de uma variável, o desvio padrão não se altera. Yi = xi + c ( (y = (x 2)- multiplicando-se todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado por essa constante. Yi = c X xi ( (y = c X (x 3)- para uma distribuição normal tem- se que: _ _ a)- 68,27% dos valores pertencem ao intervalo ( X -( ; X + () _ _ b)- 95,45% dos valores pertencem ao intervalo ( X - 2( ; X + 2() _ _ c)- 99,73% dos valores pertencem ao intervalo ( X - 3( ; X + 3() Dados não agrupados Tomemos por exemplo, o conjunto de valores da variável x: 40, 45, 48, 52, 54, 62, 70 O método mais prático para se obter o desvio padrão é formar uma tabela com duas colunas: uma para xi e outra para xi2: xi xi2 40 1.600 45 2.025 48 2.304 52 2.704 54 2.916 62 3.844 70 4.900 (= 371 (= 20.293 Como n = 7, temos: ____________________ ____________ ( = ( (20.293 / 7) – ( 371 / 7 )2 = ( 2.899 – (53)2 = ____________ ___ ( 2.899 – 2.809 = ( 90 = 9,486 logo ( = 9,49 Comparemos os dados relativos aos grupos A, B, e C Grupo A A= 69, 70, 70, 70, 71 Xi xi2 69 4.761 70 4.900 70 4.900 70 4.900 71 5.041 (=350 (= 24.502 ____________________ ____________ ( = ( (24.502 / 5) – ( 350 / 5 )2 = ( 4.900,4 – (70)2 = _____________ ___ ( 4.900,4 – 4.900 = ( 0,4 = 0,63 logo ( = 0,63 Grupo B B= 60, 62, 70, 80, 83 Xi xi2 60 3.600 62 3.844 70 4.900 80 6.400 83 6.889 (=355 (= 25.633 ____________________ ____________ ( = ( (25.633 / 5) – ( 355 / 5 )2 = ( 5.126,6 – (71)2 = _____________ ____ ( 5.126,6 – 5.041 = ( 85.6 = 9,25 logo ( = 9,25 Grupo C C= 40, 50, 50, 60, 63 Xi xi2 40 1.600 50 2.500 50 2.500 60 3.600 63 3.969 (=263 (= 14.169 ____________________ ______________ ( = ( (14.169 / 5) – ( 263 / 5 )2 = ( 2.833,8 – (52,6)2 = _______________ _____ ( 2.833,8 – 2.766,8 = ( 67,04 = 8,19 logo ( = 8,19 Com os cálculos dos desvios padrão podemos comparar os três grupos de dados, onde apesar de médias aritméticas próximas os grupos A e B possuem performance bem distintas com desvios padrão 0,63 e 9,25 resultando em uma maior dispersão dos resultados no grupo B. Os grupos B e C apesar de amplitudes iguais possuem média aritméticas distintas e desvios padrão distintos. Dados agrupados Sem intervalos de classe Neste caso, temos a presença de freqüências, devemos levá-las em consideração, resultando na fórmula: _________________ ( = ( ((fixi2)/n – ((fixi /n)2 Considerando o exemplo a seguir, formando colunas para xifi e xi2fi, temos: xi fi xifi xi2fi 0 2 0 0 1 6 6 6 2 12 24 48 3 7 21 63 4 3 12 48 TOTAL ( = 30 ( = 63 ( = 165 Logo: _______________ _________ ____ ( = ( 165/30 – (63 /30)2 = ( 5,5 –4,41 = ( 1,09 = 1,044 Daí ( = 1,04 Dados agrupados com intervalos de classes i Estatura (cm) fi xi fixi fixi2 1 150 |--- 154 4 152 608 92.416 2 154 |--- 158 9 156 1.404 219.024 3 158 |--- 162 11 160 1.760 281.600 4 162 |--- 166 8 164 1.312 215.168 5 166 |--- 170 5 168 840 141.120 6 170 |--- 174 3 172 516 88.752 ( = 40 ( = 6.440 ( = 1.038.080 Logo _______________________ _____________ ___ ( = ( (1.038.080)/40 – (6.440/40)2 = ( 25.952 –25.921 = ( 31 = 5,567 Daí ( = 5,57 cm Dependendo da variável estudada os valores estudados podem ser numericamente extensos, podemos daí usar o método breve para o cálculo do desvio padrão. Processo Breve Baseado na mudança da variável x por outra y, tal que: Yi = xi – x0 h e pelas mesmas razões expostas para o cálculo da média, podemos obter um processo breve de cálculo, com a aplicação da seguinte fórmula: _________________ ( = h ( ((fiyi2)/n – ((fiyi /n)2 Aplicando no exemplo: i Estatura (cm) fi Yi fiyi fiyi2 1 150 |--- 154 4 - 2 - 8 16 2 154 |--- 158 9 - 1 - 9 9 3 158 |--- 162 11 0 0 0 4 162 |--- 166 8 1 8 8 5 166 |--- 170 5 2 10 20 6 170 |--- 174 3 3 9 27 ( = 40 ( = 10 ( = 80 Logo: ________________ __________ ______ ( = 4 ( (80)/40 – (10 /40)2 = 4 ( 2 – 0,0625 = 4 ( 1,9375 = 4x 1,3919 = 5,5676 Daí : ( = 5,57 cm confirmando o método anterior. ZONA DE NORMALIDADE É a região compreendida entre _ _ X - ( e X + ( Onde no exemplo anterior temos _ X - ( = 161 – 5,57 = 155,43 _ X + ( = 161 + 5,57 = 166,57 COEFICIENTE DE VARIAÇÃO O coeficiente de variação é utilizado para comparação entre duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade. É caracterizado pela razão entre o desvio padrão e a média aritmética com o resultado multiplicado por 100 para termos a resposta em porcentagem. _ CV =(( / X ) x 100 Para o exemplo estudado com desvio padrão ( = 5,57 e média aritmética = 161, temos: CV = 5,57 x 100 = 0,03459 x 100 = 3,459 CV = 3,5 % 161 Exemplo: Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos: _ X ( Estaturas 175 cm 5,0 cm Pesos 68 kg 2,0 kg Temos: CVe = 5 x 100 = 0,0285 x 100 = 2,85% 175 CVp = 2 x 100 = 0,0294 x 100 = 2,94% 68 Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão que as estaturas. MEDIDAS DE ASSIMETRIA MEDIDAS DE CURTOSE A natureza da assimetria já foi estudada na representação gráfica de uma distribuição de freqüência. Numa distribuição simétrica, temos a coincidência dos valores da média e moda; numa distribuição assimétrica à esquerda ou negativa, a média é menor que a moda; na distribuição assimétrica à direita ou positiva, a média é maior que a moda. Temos daí as seguintes relações: _ X – Mo = 0 ( assimetria nula ou distribuição simétrica _ X – Mo ( 0 assimetria negativa ou à esquerda _ X – Mo ( 0 assimetria positiva ou à direita Exemplos: DISTRIBUIÇÃO 1 Fi 24 18 12 6 0 0 2 6 10 14 18 22 Peso PESOS (kg) Fi 2|--- 6 6 6|--- 10 12 10|--- 14 24 14|--- 18 12 18|--- 22 6 (=60 Temos:_ X = 12 kg Md = 12 kg 12 – 12 = 0 distribuição simétrica Mo = 12 kg ( = 4,42 kg DISTRIBUIÇÃO 2 fi 30 24 18 PESOS fi 2|--- 6 6 6|--- 10 12 12 10|--- 14 24 14|--- 18 30 18|--- 22 6 6 (=78 0 0 2 6 10 14 18 22 Peso _ X = 12,9 kg Md = 13,5 kg Mo = 16,0 kg ( = 4,20 kg 12,9 – 16,0 = - 3,1 kg distribuição assimétrica negativa DISTRIBUIÇÃO 3 fi 30 24 PESOS fi 2|--- 6 6 18 6|--- 10 30 10|--- 14 24 12 14|--- 18 12 18|--- 22 6 6 (=78 0 0 2 6 10 14 18 22 Peso _ X = 11,10 kg Md = 10,50 kg 11,10 – 8,00 = 3,1 kg distribuição assimétrica positiva Mo = 8,00 kg ( = 4,20 kg COEFICIENTE DE ASSIMETRIA Também chamado de coeficiente de assimetria de Pearson e dado por: _ As = 3 ( X – Md ) ( Onde : 0,15 ( | As | ( 1, assimetria moderada | As | ( 1, assimetria forte Exemplo; Considerando as distribuições anteriores 1, 2, 3, temos: As1 = 3 ( 12 – 12) = 0 simetria As2 = 3 ( 12,9 – 13,5) = - 0,429 ( assimetria negativa As3 = 3 ( 11,1 – 10,5) = 0, 429 ( assimetria positiva CURTOSE Denomina-se curtose o grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada curva normal. Quando a distribuição apresenta uma curva de freqüência mais fechada que a normal , ela recebe o nome de leptocúrtiva. Quando a distribuição apresenta uma curva de freqüência mais aberta que a normal , ela recebe o nome de platicúrtica. A curva normal recebe o nome de mesocúrtica. A fórmula para a medida da curtose é: C = Q3 – Q1 2( P90 – P10) também conhecida como coeficiente percentílico de curtose Relativamente à curva normal temos: C = 0,263 Se: C = 0,264 ( curva mesocúrtica C ( 0,263 ( curva leptocúrtica C ( 0,263 ( curva platicúrtica Exemplo: Sabendo que uma distribuição apresenta as seguintes medidas: Q1 = 24,4 cm, Q3 = 41,2 cm, P10 = 20,2 cm, P90 = 49,5 cm Temos: C = 41,2 – 24,4__ = 16, 8 = 0,287 C( 0,263 curva platicúrtica 2( 49,5 – 20,2) 58,6
Compartilhar