Baixe o app para aproveitar ainda mais
Prévia do material em texto
CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 1 Unidade 2: MEDIDAS DE POSIÇÃO - MEDIDAS DE DISPERSÃO As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de tendência central, destacamos: • a média aritmética; • a mediana; • a moda. • As outras medidas de posição são as separatrizes, que englobam: • a própria mediana; • os quartis; • os decis; • os percentis. 2.1 Medidas de Tendência Central Depois de fazer a coleta e a representação dos dados de uma pesquisa, é comum analisarmos as tendências que essa pesquisa revela. Assim, se a pesquisa envolve muitos dados, convêm sintetizarmos todas essas informações a um mínimo de parâmetros que possam caracterizá-la. Esses parâmetros podem ser de: - Centralização: média aritmética, mediana, moda. - Dispersão: Amplitude total, Desvio médio, variância, desvio padrão e Coeficiente de Variação. - Separatrizes: Quartis, Decis e Percentis. 1 . Média Aritmética Veja a situação a seguir: Uma livraria vende a seguinte quantidade de livros de literatura durante uma certa semana: 2ª feira 3ª feira 4ª feira 5ª feira 6ª feira Sábado 28 23 22 27 25 13 Qual foi a média diária de livros vendidos durante essa semana? Para resolver esse problema, devemos fazer: 28 23 22 27 25 13 138 23 6 6 + + + + + = = O número 23 é chamado média aritmética dos números 28, 23, 22, 27, 25 e 13. A média aritmética significa que, se numa situação imaginária a venda diária dessa semana fosse sempre a mesma, ou seja, 23 livros por dia, iríamos obter o mesmo total de livros vendidos: 138. Assim na 4ª feira e no sábado a venda da livraria foi abaixo da média, enquanto na 2ª, 5ª e 6ª feira foi acima da média. 1.1. Média aritmética ( x ) dos valores x1, x2, x3, K, xn é o quociente entre a soma desses valores e o seu número total n: 1 2 3 ... nx x x xx n + + + = 1.2. Média Aritmética Ponderada A tabela a seguir mostra a distribuição dos salários de uma empresa CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 2 Salários (em reais) Número de funcionários 600,00 12 900,00 7 1200,00 5 1800,00 6 4500,00 8 ∑ 38 Qual a média salarial dos funcionários dessa empresa? Observando a tabela: - 12 funcionários ganham 600,00 (600,00 se repete 12 vezes) - 7 funcionários ganham 900,00 (900,00 se repete 7 vezes) - 5 funcionários ganham 1200,00 (1200,00 se repete 5 vezes) - 6 funcionários ganham 1800,00 (1800,00 se repete 6 vezes) - 8 funcionários ganham 4500,00 (4500,00 se repete 8 vezes) Assim, a média salarial x desses funcionários pode ser calculada da seguinte forma: 600,00.12 900,00.7 1200,00.5 1800,00.6 4500,00.8 12 7 5 6 8 x + + + + + + + + = 7200 6300 6000 10800 3600 66300 38 0 38 x + + = + + = x ≅1744,73 Portanto, a média salarial dos funcionários dessa empresa é de R$ 1744,73. Essa média é conhecida como média aritmética ponderada e o número de vezes em que o salário se repete são denominados pesos. A média aritmética ponderada facilita o cálculo de médias, quando há valores que se repetem várias vezes. Nesse caso, multiplicamos os valores pelo número de vezes (peso) em que eles ocorrem. x = 1 1 2 2 3 3 1 2 3 n n n x f x f x f K x f f f f K f + + + + + + + + ou x = 1 1 n i i i n i i x f f = = Observação: Algumas vantagens e desvantagens no uso da média. Vantagens: - É de fácil cálculo; - Do seu cálculo participam todos os elementos da distribuição; - Admite tratamento algébrico; - Em qualquer caso a média aritmética tem um somente valor determinado. Desvantagens: - A rigor a média deve ser usada somente nas distribuições simétricas ou aproximadamente assimétricas; - É influenciada por valores extremos da distribuição. CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 3 Exemplos: 1) No ano de 2000, o número de nascimentos, por mês, em uma maternidade foi: Mês Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Nascimento 38 25 42 30 29 47 18 36 38 43 49 37 a) Calcule a média mensal de nascimentos. b) Em que meses o número de nascimentos ficou acima da média? Solução: a) A média mensal de nascimentos em 12 meses é dada por: x = 38 25 42 30 29 47 18 36 38 43 49 37 12 + + + + + + + + + + + x = 432 12 x = 36 Portanto, a média de nascimento foi de 36 nascimentos por mês. b) O número de nascimentos ficou acima da média nos seguintes meses: janeiro, março, junho, setembro, outubro, novembro e dezembro. 2) O quadro de distribuição de frequências representa os salários mensais de 40 empregados de uma firma. Salários dos Funcionários da empresa X Classe (em reais) Ponto Médio da Classe (xi) Número de funcionários (fi) [180,200[ 190 4 [200,220[ 210 18 [220,240[ 230 10 [240,260[ 250 5 [260,280[ 270 3 Fonte: X Calcule o salário médio mensal dos empregados dessa firma. Solução: Quando os dados estão agrupados, se aceita, por convenção, que as frequências se distribuem uniformemente ao longo da classe e que, portanto, o ponto médio da classe é o valor representativo do conjunto. Nesse caso, a média é calculada partindo-se do ponto médio da classe. Para calcular o salário médio, devemos fazer: x = 190.4 210.18 230.10 250.5 270.3 4 18 10 5 3 + + + + + + + + x = 760 3780 2300 1750 810 40 + + + + 8900 40 222,50 = Portanto, o salário médio é de R$ 220,50. x = 760 3780 2300 1750 810 8900 40 4 22 ,50 0 2 = + + + + CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 4 2 . Mediana As nove classes de 3º ano do Ensino Médio de uma escola têm, respectivamente:37, 28,40,41,45,37,37,41,44 alunos. Colocando esses dados em ordem crescente: 28, 37, 37, 37, 40, 41, 41, 44, 45. A distribuição tem um número ímpar (9) de dados. Há quatro valores à esquerda de 40 e quatro valores à direita de 40. Dizemos que o valor central dessa distribuição, 40, é a mediana. Indicamos: Md = 40 O valor que ocupa a posição central de um conjunto de valores, colocados em ordem crescente ou decrescente de grandeza, é chamado mediana. Se a distribuição tiver um número par de dados, não existe um valor central, mas dois valores centrais. Nesse caso, a mediana é a média aritmética dos dois valores centrais. A mediana separa o conjunto de dados em dois grupos, cada um com metade dos elementos do conjunto. A mediana não precisa ser necessariamente um elemento desse conjunto. No exemplo acima, a mediana 40 é um elemento da distribuição. Vejamos agora um exemplo no qual a mediana não é um elemento da distribuição: Sejam as seis notas de um determinado aluno, 45, 55, 64, 89, 23 e 75. Colocando em ordem crescente temos: 23, 45, 55, 64, 75, 89. A distribuição tem um número par (6) de dados. Então devemos pegar os dois valores centrais e tirar a média aritmética: 55 64 119 59,5 2 2 d dM M + = = = CÁLCULO DA MEDIANA Para determinar o valor que divide a distribuição em dois grupos que contenham o mesmo número de elementos, recorre-se à frequência acumulada, e identifica-se a qual classe pertence o elemento central, da mesma forma que se procedeu para os dados não agrupados. Em função de n ser par ou ímpar e do valor da frequência acumulada da classe, determina-se o valor da Mediana. Necessitamos da DF com a coluna correspondente a fa, conforme mostrado abaixo. xi fi fa 17 3 3 18 18 21 19 17 38 20 8 46 21 4 50 Σ 50Em virtude do tamanho da amostra (n) ser par (50), precisamos identificar quais as idades do 25º (n/2) e do 26º (consecutivo) alunos na amostra ordenada (elementos centrais), para calcular a MEDIANA como a média das idades destes dois alunos. Nosso problema reside então em identificar quais as idades dos dois alunos centrais, para o que necessitamos da Frequência Acumulada. Vamos observar o seguinte raciocínio: A primeira classe (17 anos) contém do 1º ao 3º (f1=3) alunos. A segunda classe (18 anos) contém do 4º até o 21º (f2=21) alunos. A terceira classe (19 anos) contém do 22º até o 38º (f3=38) alunos. Pergunta-se: em qual classe está o 25º aluno? E o 26º? Se a 3ª classe agrupa do 22º até o 38º alunos, então o 25º e o 26º estão nesta classe. Assim, o 25º aluno está na 3ª classe e possui 19 anos e o 26º aluno também está na 3ª classe e também possui 19 anos. Resumindo: Elementos centrais Idades 25º aluno tem 19 anos. 26º aluno tem 19 anos. Logo, Md=19 anos (média de 19 anos e 19 anos). CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 5 Suponha agora que na turma acima, tenham ingressado 4 alunos com 20 anos e 3 alunos com 21 anos. A nova DF da turma passaria a ser: xi fi fa 17 3 3 18 18 21 19 17 38 20 12 50 21 7 57 Σ 57 Qual seria a nova MEDIANA? Como agora n é ímpar, existe um único valor central, que é o elemento de ordem (57+1)/2 = 29º. Qual a classe que contém o 29º aluno? Observa-se que o 29º aluno está na 3ª classe. Qual a IDADE do 29º aluno? A idade do 29º aluno é 19 anos. Logo, Md=19 anos (idade do elemento central único). CÁLCULO DA MEDIANA COM INTERVALOS DE CLASSE Para determinar a mediana dos dados agrupados em tabelas com intervalos de classes, devemos seguir os seguintes passos: a) Determinar as frequências acumuladas absolutas. b) Calcular a ordem do elemento mediano n/2 ou equivalentemente nxP, onde P=50% (0,50) c) Identificar a classe correspondente à frequência acumulada imediatamente superior a n/2, que é a classe que contém a mediana, para em seguida aplicar a fórmula: Onde: lmed = limite inferior da classe mediana fmed = frequência absoluta da classe mediana fant = frequência acumulada da classe anterior à classe mediana hmed = amplitude do intervalo da classe mediana NOTA: No caso de VARIÁVEIS CONTÍNUAS, não é necessário identificar se n é par ou ímpar. EXEMPLO DE CÁLCULO: Salários ($) fi fa 200 |---- 300 2 2 300 |---- 400 3 5 400 |---- 500 13 18 500 |---- 600 11 29 600 |---- 700 9 38 700 |---- 800 2 40 Σ 40 Identificando componentes da fórmula: (n/2) ou (50% de n)=20; Classe Mediana=4ª; lmed=500; fmed=11; hmed=100; fant=18 Observação: Algumas vantagens e desvantagens no uso da mediana Vantagens: - A mediana pode ser calculada nas distribuições que apresentam classes de limites indeterminados; - A mediana não é influenciada pela grandeza de valores externos. Desvantagens: - É um valor aproximado, isto porque para obtermos a expressão para seu cálculo admitimos todos os valores distribuídos uniformemente por toda a classe; - Não admite tratamento algébrico. / 2n fant Md lmed hmed fmed − = + Classe Medianal 1ª Classe com F maior ou igual a n/2 (20). 18,518$Md100 11 2 500Md100 11 )1820( 500Md =+= − += CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 6 3 . Moda Feita uma pesquisa para saber o número de irmãos que cada um dos 30 alunos de uma classe possui, obteve-se a seguinte sequência: 0, 2, 3, 2, 1, 2, 2, 1, 1, 2, 1, 2, 0, 1, 2, 0, 2, 2, 3, 4, 2, 2, 3, 1, 3, 2, 5, 2, 4, 4 Fazendo a contagem, obtemos a tabela: Número de irmãos que cada um dos 30 alunos de uma classe Nº de irmãos fi 0 3 1 6 2 13 3 4 4 3 5 1 Fonte: Escola Verde Limão Observe que o número de irmãos varia entre 0 e 5 e o número que aparece mais vezes é o 2, isto é, 13 alunos tem 2 irmãos. Dizemos que 2 é a moda desse conjunto de valores e indicamos: Mo = 2 Moda de um conjunto de valores é o valor que aparece um maior número de vezes, ou seja, é o valor de maior frequência absoluta. Um conjunto de valores pode ter uma só moda, duas modas, três modas etc., ou nenhuma moda. Para ilustrar, observe as notas de recuperação em Português obtidas por três classes de uma escola e suas respectivas modas: Classe Notas Moda 3º A 4, 5, 6, 7, 8, 8, 9 8 3º B 3, 5, 6, 6, 7, 7, 9 6 e 7 3º C 3, 4, 5, 6, 7, 8, 9, 10 não tem Moda - Com intervalo de classes A classe que apresenta a maior frequência simples absoluta é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. Temos então: * 2 * oM + = l L Onde: l* é o limite inferior da classe modal L* é o limite superior da classe modal Para a distribuição abaixo: vamos calcular a moda CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 7 Salários ($) fi xi 200 |---- 300 2 250 300 |---- 400 3 350 400 |---- 500 13 450 500 |---- 600 11 550 600 |---- 700 9 650 700 |---- 800 2 750 Σ 40 400 500 900 450 2 2 oM = + = = Logo, a MODA BRUTA é Mo = $450,00 Moda Exata ou Moda de Czuber É uma medida mais precisa, pois leva em consideração as frequências das classes anterior à modal, da classe modal e da classe posterior à classe modal. 1 1 2 o mo D M l h D D = + + Onde: lmo – limite inferior da classe modal fmo – frequência absoluta da classe modal fant – frequência absoluta da classe anterior à classe modal fpos – frequência absoluta da classe posterior à classe modal h – amplitude do intervalo de classe D1 = fmo – fant e D2 = fmo – fpos Salários ($) fi xi 200 |---- 300 2 250 300 |---- 400 3 350 400 |---- 500 13 450 500 |---- 600 11 550 600 |---- 700 9 650 700 |---- 800 2 750 Σ 40 Identificando componentes da fórmula: mo=400; D1 = 13-3 =10; D2 =13-11 = 2; h= 500-400 =100 Observação: Algumas vantagens e desvantagens no uso da moda. Vantagens: - Pode ser calculada nas distribuições que apresentam classes indeterminadas desde que a indeterminação não recaia na classe modal; Classe Modal Classe Modal 33,483$100 210 10 400Mo = + += CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 8 - Não é influenciada pelos valores externos, o que possibilita ser empregada nas atribuições assimétricas. Desvantagens: - Não admite tratamento algébrico; - É obtida através de fórmulas de aproximação. Posição relativa da Média, Moda e Mediana Embora o conceito de simetria não tenha sido introduzido ainda, é muito fácil de ser entendido e será necessário para verificarmos como a forma de uma DF influencia os valores das três medidas de posição. Numa distribuição de frequências SIMÉTRICA em relação à MÉDIA, os valores da MÉDIA, MODA e MEDIANA coincidem, e não é difícil de visualizarmos este fato. Uma distribuição é ASSIMÉTRICA POSITIVA quando os valores de seu extremo superior estão mais afastados da MÉDIA que seus valores do extremo inferior, resultando num contorno que apresenta uma cauda mais longa na direção do extremo superior dos valores. No item anterior foi enfatizado que a MÉDIA é a única medida de posição que é afetada pelos valores extremos. A ASSIMETRIA POSITIVA afeta a MÉDIA ‘puxando-a’ em sua direção, ou seja,na direção da cauda mais longa que é a superior. Observe o que acontece com as três medidas de posição neste caso. Reciprocamente, uma ASSIMETRIA NEGATIVA apresenta uma cauda mais longa na direção dos valores extremos inferiores, o que afeta a MÉDIA ‘puxando-a’ também na direção dos valores extremos inferiores. A MODA é facilmente identificável em ambos os casos: é a ordenada correspondente ao pico (máximo) de frequência. Diante da constatação de que a cauda mais longa traz a MÉDIA para seu lado, é fácil percebermos que a cauda mais longa acaba por puxar para seu lado a MEDIANA também, quando confrontada com a MODA. Assim, mesmo sem calcular os valores das três medidas, dependendo da forma (gráfico) da DF, podemos estabelecer as relações acima entre as três medidas. Exemplos: 1) O quadro de frequências, a seguir, refere-se às idades dos jogadores de basquete de um clube. Idades dos jogadores de basquete de um clube Idade (xi) Nº de jogadores (fi) fa 13 6 6 14 12 18 15 15 33 20 24 57 23 9 66 Fonte: Joinville Qual será a moda e a mediana dos dados nesse caso? CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 9 Solução: Determinar a moda dessa distribuição basta observar o valor de xi para o qual a frequência absoluta é maior. Logo, a moda é 20. Vamos calcular, inicialmente, o número de dados: 6 + 12 + 15 + 24 + 9 = 66 Temos, portanto, um número par de dados. Vamos, então, determinar as ordens dos dois termos centrais: 66 / 2 = 33. Então, será a 33ª e 34ª. Observando o quadro, notamos que 33ª posição (6 + 12 + 15 = 33) é ocupada pelo valor 15 e que 34ª posição é ocupada pelo valor 20. 15 20 35 17,5 2 2 d dM M + = = = A mediana é igual a 17,5. 2) O quadro de distribuição de frequência seguinte representa as alturas de 200 jovens. Alturas de 200 Jovens de uma Academia Classe fi fa [160;165 [ 8 8 [165;170 [ 15 23 [170;175 [ 10 33 [175;180 [ 40 73 [180,185 [ 90 163 [185,190 [ 20 183 [190,195 [ 15 198 [195,200 [ 2 200 Fonte:Y Qual a mediana dessa distribuição? E a moda? Verificamos que a mediana se encontra na classe relacionada à frequência imediatamente maior que a semi-soma das frequências absolutas, neste caso 200 100 2 = . Observando a coluna de frequências absolutas acumuladas, esse elemento se encontra na classe correspondente a [180,185[. Essa classe é chamada classe mediana. (n/2) ou (50% de n) = 100; Classe Mediana = 5ª; lmed = 180; fmed = 90; hmed = 5; fant = 73 100 73 180 5 90 27 180 5 90 180 0,3 5 180 1,5 181,5 d d d d d M M M M M − = + = + = + = + = / 2n fant Md lmed hmed fmed − = + CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 10 Moda Bruta: * * 2 o l L M + = 365 182,5 2 180 2 185 oM = = = + Moda exata: 1 1 2 50 180 5 50 70 50 180 5 120 180 0, 416 5 180 2,083 182,083 o mo o o o o o D M l h D D M M M M M = + + = + + = + + + Propriedades das medidas de Posição Propriedades da Moda A Moda é o valor mais frequente de uma série. - Não depende dos extremos de uma série; - Se somarmos ou subtrairmos um valor constante K a cada um dos elementos de uma série, a moda ficará somada ou subtraída por essa constante; - Se multiplicarmos ou dividirmos um valor constante K a cada um dos elementos de uma série, a moda ficará multiplicada ou dividida por essa constante. Propriedades da Mediana A Mediana é o valor que ocupa a posição central em uma série ordenada. - Não depende dos extremos de uma série; - Se somarmos ou subtrairmos um valor constante K a cada um dos elementos de uma série, a mediana ficará somada ou subtraída por essa constante; - Se multiplicarmos ou dividirmos um valor constante K a cada um dos elementos de uma série, a mediana ficará multiplicada ou dividida por essa constante. Propriedades das Médias Média é o valor mais representativo de uma série. - Depende dos extremos de uma série; - Se somarmos ou subtrairmos um valor constante K a cada um dos elementos de uma série, a média aritmética ficará somada ou subtraída por essa constante; - Se multiplicarmos ou dividirmos um valor constante K a cada um dos elementos de uma série, a média aritmética ficará multiplicada ou dividida por essa constante CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 11 MEDIDAS DE POSIÇÃO: MEDIDAS SEPARATRIZES Muitas vezes torna-se necessário conhecermos outras medidas, além das de Tendência Central. Assim, nesta Unidade estaremos estudando medidas de posição chamadas Separatrizes: Mediana, quartis, decis e percentis. Mediana é uma medida de posição que é simultaneamente, medida de tendência central e medida separatriz. Por esse motivo a mediana foi estudada na Unidade VI, assim passaremos ao estudo dos quartis, posteriormente dos decis e percentis. Já estudamos que a mediana separa a série em duas partes iguais, e que cada parte contém o mesmo número de elementos. Contudo, uma mesma série pode ser dividida em duas ou mais partes que contenham a mesma quantidade de elementos. O nome da medida de posição separatriz será de acordo com a quantidade de partes em que é dividida a série. • Mediana: divide a série em duas partes iguais (Xmd); • Quartis: divide a série em quatro partes iguais (Q1, Q2, Q3); • Decis: divide a série em 10 partes iguais (D1, D2, D3, D4, D5, D6, D7, D8, D9); • Percentis: divide a série em 100 partes iguais (P1, P2, P3, ..., P99). Quartis (QK) Nos quartis, a série é dividida em quatro partes iguais. Os elementos separatrizes da série são Q1, Q2, e Q3. 25% 50% 75% Q1 Q2 Q3 Q1: é o primeiro quartil, corresponde à separação dos primeiros 25% de elementos da série. Q2: é o segundo quartil, coincide com a mediana (Q2 = Md). Q3: é o terceiro quartil, corresponde à separação dos últimos 25% de elementos da série, ou seja, os 75% dos elementos da série. Para o cálculo dos quartis utilizam-se técnicas semelhantes àquelas do cálculo da mediana. Consequentemente, podem-se utilizar as mesmas fórmulas do cálculo da mediana, levando em conta que onde houver a expressão 2 if será substituída por 4 ifK , sendo K o número da ordem do quartil, em que K =1 corresponde ao primeiro quartil; K = 2 corresponde ao segundo quartil e K = 3 ao terceiro quartil. Cálculo do quartil para o rol 1° Passo: Determina-se a posição do Quartil. )32,1( 4 ouKonde Kn P QK == 2° Passo: Identifica-se a posição mais próxima do rol. 3° Passo: Verifica-se quem está naquela posição. Exemplo: Calcule Q1, Q2 e Q3 para o seguinte conjunto de valores: 12,9,2,6,8,7,10,11,0,8,1,4A Inicialmente precisamos colocar os valores em ordem (rol) 12,11,10,9,8,8,7,6,4,2,1,0A a) Vamos utilizar os passos para o cálculo do 1° quartil: 1° Passo: Determina-se a posição do 1° quartil: quartildoposiçãoP Q 1 3 4 121 1 = = 2° Passo: Identificar a posição 3 3° Passo: Procura-se no rol o valor do número que está na posição identificada. CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 12 O número que corresponde a 25% do rol é o valor 2 b) Vamos utilizar os passos para o cálculo do 2° quartil: 1° Passo: Determina-se a posição do 2° quartil: quartildoposiçãoP Q 2 6 4 122 2 = = 2° Passo: Identificar a posição 6 3° Passo: Procura-se no rol o valor do número que está na posição identificada.O número que corresponde a 50% do rol é o valor 7 c) Vamos utilizar os passos para o cálculo do 3° quartil: 1° Passo: Determina-se a posição do 3° quartil: quartildoposiçãoP Q 3 9 4 123 3 = = 2° Passo: Identificar a posição 9 3° Passo: Procura-se no rol o valor do número que está na posição identificada. 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x 10 x 11 x 12 x 0 1 2 4 6 7 8 8 9 10 11 12 O número que corresponde a 75% do rol é o valor 9 Cálculo do quartil para a tabela sem intervalo de classe 1° Passo: Calcula-se a posição do quartil. )32,1( 4 ouKonde fK P i QK == 2° Passo: É necessário inserir a coluna da frequência acumulada, e nela procurar o valor da posição do quartil. 3° Passo: O Valor do quartil será o valor da variável que corresponde àquela classe. Exemplo: Calcular os valores do Q1, Q2 e Q3 da tabela seguinte: Números de acidentes /mês no Cruzamento X em CG/16 N° de acidentes / mês fi fa 0 4 4 1 6 10 2 9 19 3 5 24 4 4 28 28if = a) Vamos calcular inicialmente Q1 1° Passo: Determinar a posição do 1° quartil (25%) quartildoposiçãoP Q 1 7 4 281 1 = = 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x 10 x 11 x 12 x 0 1 2 4 6 7 8 8 9 10 11 12 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x 10 x 11 x 12 x 0 1 2 4 6 7 8 8 9 10 11 12 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x 10 x 11 x 12 x 0 1 2 4 6 7 8 8 9 10 11 12 CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 13 2° Passo: Procurar na coluna da fa a posição do 7° elemento 3° Passo: A variável que corresponde à posição do 7° elemento é 1 (na segunda classe). 25% da pesquisa mostrou que este cruzamento teve 1 acidente / mês. b) Vamos calcular o Q2 1° Passo: Determinar a posição do 2° quartil (50%) quartildoposiçãoP Q 2 14 4 282 2 = = 2° Passo: Procurar na coluna da fa a posição do 14° elemento 3° Passo: A variável que corresponde à posição do 14° elemento é 2 (na terceira classe). 50% da pesquisa mostrou que este cruzamento teve 2 acidentes / mês. c) Vamos calcular o Q3 1° Passo: Determinar a posição do 3° quartil (50%) quartildoposiçãoP Q 3 21 4 283 3 = = 2° Passo: Procurar na coluna da fa a posição do 21° elemento 3° Passo: A variável que corresponde à posição do 21° elemento é 3 (na quarta classe). 75% da pesquisa mostrou que este cruzamento teve 3 acidentes / mês. Cálculo do quartil em tabelas com intervalo de classe Determina-se, inicialmente, a classe que contém o valor quartil a ser calculado. A identificação da classe é feita por meio do termo da ordem calculada pela expressão: )32,1( 4 ouKonde fK P i QK == Essa expressão determina a posição do referente quartil ou classe que contém o quartil. Assim, temos: 4 ant k qk Qk QK K fi f Q l a f − = + Sendo: lQk = limite inferior da classe do quartil considerado. fant = frequência acumulada da classe anterior à classe do quartil considerado. aQK = amplitude do intervalo de classe do quartil considerado. fQK = frequência simples da classe do quartil considerado. Exemplo: Para o cálculo dos quartis de dados agrupados com intervalos de classe, consideramos a distribuição dos pesos de um grupo de turistas que visita um parque temático em Fortaleza/CE/Julho/16. Será acrescentada uma coluna com os valores da frequência acumulada. Pesos de um grupo de turistas do Parque Temático Fortaleza/CE/Julho/16. i Pesos (kg) Frequência (fi) Frequência acumulada (fa) 1 10 ├ 30 10 10 2 30 ├ 50 24 34 3 50 ├ 70 57 91 4 70 ├ 90 44 135 5 90 ├ 110 29 164 6 110 ├ 130 16 180 180if = Primeiro, calcula-se a classe a que pertence o quartil Q1 (k=1), ou seja, a posição: CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 14 P Q1 = 45 4 180 4 1 == if Observando a coluna de frequência acumulada, verificamos que o quadragésimo quinto termo pertence à terceira classe (a frequência acumulada da teceria classe abrange do 35º termo ao 91º termo). Sabendo que a classe do primeiro quartil é a terceira classe, podemos verificar qual o valor numérico do primeiro quartil utilizando a expressão: 1 1 1 1 1 1 4 ant Q Q Q f f Q l a f − = + = 50 + kg9,5320 57 3445 − Os cálculos para os quartis Q2 e Q3 processam-se de forma análoga ao cálculo do primeiro quartil. 2° quartil 90 4 1802 4 2 = =→ if (o segundo quartil pertence à terceira classe). 2 22 2 2 90 344 50 20 69,7 kg 57 i ant Q Q Q f f Q l a f − − = + • = + 3° quartil 135 4 1803 4 3 = =→ if (o terceiro quartil pertence à quarta classe) 3 33 3 3 135 914 70 20 90,0 kg 44 i ant Q Q Q f f Q l a f − − = + • = + = Assim temos: Q1 = 53,9 kg; Q2 = 69,7 kg e Q3 = 90,0 kg Observação: Desvio quartílico (Desvio quartil) É a média da diferença entre o terceiro e o primeiro quartis ou intervalo interquartílico No exemplo anterior, Dq = 3 1 90 53,9 36,1 18,05 2 2 2 Q Q− − = = = Decis (DK) Nos decis, a série é dividida em 10 partes iguais (D1, D2, D3, ...D9). 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% D1 D2 D3 D4 D5 D6 D7 D8 D9 D1: é o primeiro decil, corresponde à separação dos primeiros 10 % de elementos da série. D5: é o quinto decil, coincide com a mediana (D5 = Md). D9: é o nono decil, corresponde à separação dos últimos 10% elementos da série. CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 15 Calculo do Decil para o rol Os passos são os mesmos para o cálculo do quartil para o rol Exemplo: Calcular D1 e D8 do conjunto dado: 24,10,18,6,4,2,20,15,12,7A Inicialmente vamos colocar o conjunto em ordem crescente: X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 2 4 6 7 10 12 15 18 20 24 a) Calcular D1 1° Passo: determina-se a posição do primeiro Decil. )( 1 10 101 10 1 1 posição n PD = = = 2° Passo: Procura-se no rol o valor do primeiro elemento; 3° passo: O valor do D1=2 que corresponde a 10% do rol b) Cálculo do D8 1° Passo: determina-se a posição do oitavo Decil. )( 8 10 108 10 8 8 posição n P D = = = 2° Passo: Procura-se no rol o valor do oitavo elemento; 3° passo: O valor do D8=18 que corresponde a 80% do rol Cálculo do Decil para tabela sem Intervalo de Classe. Os procedimentos são os mesmos utilizados para o cálculo dos quartis. Exemplos: Calcular D3 e D8 usando a seguinte tabela: Quantidade de filhos dos funcionários de uma pequena empresa. filhos fi fa 0 18 18 1 35 53 2 46 99 3 28 127 4 25 152 5 10 162 6 5 167 7 3 170 170if = a) Cálculo do D3 1° Passo: Calcula-se a posição do D3 3 3 3 170 51 (posição) 10 10 if D = = = 2° passo: Procura-se a posição do D3 pela coluna da frequência acumulada, o D3 está na 2° classe (fa 53) 3° Passo: O valor da variável na segunda classe é 1 filho, que corresponde a 30% da pesquisa. b) Cálculo do D8 1° Passo: Calcula-se a posição do D8 8 8 8 170 144 (posição) 10 10 if D = = = 2° passo: Procura-se a posição do D8 pela coluna da frequência acumulada, o D8 está na 5° classe (fa 152) 3° Passo: O valor da variável na segunda classe é 4 filhos, que corresponde a 80% da pesquisa. CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 16 Cálculo do decil para tabela com intervalo de classe Primeiramente, determina-se a classe que contémo valor do decil a ser calculado pela expressão: 9)1,2,3,...,K (para 10 = ifK Esse termo está localizado numa classe que recebe o nome de classe decil. Para o cálculo dos decis, utilizamos técnicas semelhantes às do cálculo dos quartis. Isto é, utilizamos a fórmula: 10 K K ant K D DK D k fi f D l a f − = + • Sendo: KD l = limite inferior da classe de decil considerado fant = frequência acumulada da classe anterior à classe de decil considerado aDK = amplitude do intervalo de classe do decil considerado fDK = frequência simples da classe do decil considerado Exemplo: O cálculo dos decis será exemplificado com os dados da Tabela 3.6 que organiza as estaturas de adolescentes, colhidas durante o período em que participaram de um acampamento, durante as férias. Estaturas dos participantes de um acampamento infantil/Bonito/Julho/16. i Estaturas (cm) Freqüência (fi) Freqüência acumulada (fa) 1 120 ├ 128 6 6 2 128 ├ 136 12 18 3 136 ├ 144 16 34 4 144 ├ 152 13 47 5 152 ├ 160 7 54 = 54 Calculam-se os decis D1, D2, ...D7, ..., de forma semelhante ao cálculo dos quartis. Primeiro decil (K=1): 4,5 10 54 10 1 == if (o primeiro decil pertence à primeira classe). 1 1 1 1 1 1 5,4 010 120 8 127,5 cm D 127,5 6 i ant D D D f f D l a cm f − − = + • = + = → = Segundo decil (K=2): 8,10 10 542 10 2 = = if (o segundo decil pertence à segunda classe). 2 2 2 2 2 2 10,8 610 128 8 131,2 cm D 131,2 12 i ant D D D f f D l a cm f − − = + • = + = → = Dessa forma, podemos calcular os outros decis. Por exemplo, cálculo do sétimo decil (K=7): 8,37 10 547 10 7 = = if (o sétimo decil pertence à quarta classe) CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 17 7 7 7 7 7 7 37,8 3410 144 8 146,3 cm D 146,3 13 i ant D D D f f D l a cm f − − = + • = + = → = Percentis (Pk) Nos percentis, a série é dividida em 100 partes iguais (P1, P2, P3, ... P99). P1: é o primeiro percentil, corresponde à separação do primeiro 1% de elementos da série. P50: é o quinquagésimo percentil, coincide com a mediana (P50 = D5 = Q2 = Md). Para o cálculo dos percentis, utilizamos técnicas semelhantes às do cálculo dos quartis e decis. Inicialmente, determina-se a classe que contém o valor percentil a ser calculado pela expressão: 100 ifK (K = 1; 2; 3;...; 98; 99) Cálculo de Percentil para rol Verificamos que o raciocínio é o mesmo utilizado para o cálculo do Quartil e Decil. Consideremos o exemplo abaixo: 1) Calcular o P28 e P82 do conjunto 20,18,21,7,13,12,10,6,4,2,15B Devemos inicialmente ordenar os valores: X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 2 4 6 7 10 12 13 15 18 20 21 a) Cálculo do P28 1° Passo: Determinar a posição do P28 08,3 100 1128 100 28 28 = = = n P 2° Passo: procura-se no rol o valor da posição do 3° elemento; 3° Passo: A variável que corresponde à posição desejada é o número 6 b) Cálculo do P82 1° Passo: Determinar a posição do P82 02,9 100 1182 100 82 28 = = = n P 2° Passo: procura-se no rol o valor da posição do 9° elemento; 3° Passo: A variável que corresponde à posição desejada é o número 18 Cálculo do Percentil para Tabela sem Intervalo de Classe O cálculo do Percentil para a tabela sem intervalo de classe é o mesmo que para os cálculos dos Quartis e Decis. Estudemos esses cálculos através do exemplo a seguir: Exemplo: Calcular P45 e P93 da tabela CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 18 Número de quartos/chalés em Bonito/MS/16 Número de quartos/chalés fi fa 1 15 15 2 30 45 3 20 65 4 12 77 5 10 87 6 8 95 = 95if a) Calcular P45 1° Passo: Determinar a posição do P45 75,42 100 9545 100 45 45 = = = n P 2° Passo: Procurar a posição do 43 elemento pela coluna da frequência acumulada, podemos observar que o elemento de posição 43 está na segunda classe; 3° Passo O valor da variável que corresponde a 45% da pesquisa revelou que os pesquisados preferem até dois quartos por chalé. b) Calcular P93 1° Passo: Determinar a posição do P93 35,88 100 9593 100 93 93 = = = n P 2° Passo: Procurar a posição do 88° elemento pela coluna da frequência acumulada, podemos observar que o elemento de posição 88 está na sexta classe; 3° Passo O valor da variável que corresponde a 93% da pesquisa revelou que os pesquisados preferem até seis quartos por chalé. Cálculo para Percentil em Tabelas com Intervalo de Classe Para o cálculo dos percentis, utilizamos técnicas semelhantes ás do cálculo dos quartis e decis. Inicialmente, determina-se a classe que contém o valor percentil a ser calculado pela expressão: .,98,99)1,2,3,4,..(K 100 = ifK Para obtenção do percentil, utilizamos a fórmula: 100 K K K i ant K P P P K f f P l a f − = + • Sendo: = KP l limite inferior da classe do percentil considerado fant = frequência acumulada da classe anterior do percentil considerado = KP a amplitude do intervalo de classe do percentil considerado KP f = frequência simples da classe do percentil considerado CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 19 Exemplo: vamos calcular o 46º percentil (K=36) e o 76° percentil (K=76): Estaturas dos participantes de um acampamento infantil/Bonito/Julho/16. i Estaturas (cm) Freqüência (fi) Freqüência acumulada (fa) 1 120 ├ 128 6 6 2 128 ├ 136 12 18 3 136 ├ 144 16 34 4 144 ├ 152 13 47 5 152 ├ 160 7 54 = 54 a) Cálculo do P46 84,24 100 5446 100 46 = = if (o quadragésimo sexto percentil pertence à terceira classe) 4646 46 46 24,84 18100 136 8 139,42 16 i ant P P f f P l a cm f − − = + = + = b) Cálculo do P76 04,41 100 5476 100 76 = = if (o percentil 76 pertence à quarta classe) 4676 46 76 41,04 34100 144 8 148,33 13 i ant P P f f P l a cm f − − = + = + = CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 20 3.1 Medidas de Dispersão Mede a dispersão dos valores de uma variável em torno de um valor de tendência central (média ou mediana) tomado como ponto de comparação. A média - ainda que considerada como um número para representar uma série de valores não consegue destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto. Vimos que a moda a mediana e a média podiam ser usadas para resumir, num único número, aquilo que é “médio” ou “típico” de um conjunto de dados. Mas a informação contida fornecida pelas medidas de posição necessita em geral ser complementada pelas medidas de dispersão. Estas servem para indicar o quanto os dados se apresentam dispersos em torno da região central. Caracterizam, portanto, o grau de variação existente no conjunto de valores. As medidas de dispersão que nos interessam são: - a amplitude total; - o desvio-padrão; - a variância; - o coeficiente de variação. 1. Amplitude Total Amplitude total – AT é a única medida de dispersão que não tem a média como ponto de referência. Quando os dados não estão agrupados a amplitude total é a diferença entre o maior e o menor valor observado: AT = (valor máximo - valor mínimo). Exemplo: Para os valores 40, 45, 48, 62 e 70 a amplitude total será: AT = 70 - 40 = 30 Quando os dados estão agrupados sem intervalos de classeainda tem-se: AT = (valor máximo - valor mínimo). Exemplo: AT = 4 - 0 = 4 Com intervalos de classe a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. Então AT = L máximo - l mínimo Exemplo: AT = 10 - 4 = 6 xi fi 0 2 1 6 3 5 4 3 Classes fi 4 |------------- 6 6 2 6 |------------- 8 8 |------------- 10 3 CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 21 A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série, não considerando os valores intermediários. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de cálculo rápido sem muita exatidão. 2. Desvio Médio Para caracterizar um conjunto de dados, em Estatística, nem sempre são suficientes à média, a moda e a mediana. Em alguns casos, temos que recorrer a outros parâmetros, que são chamados medidas de dispersão. Estudaremos três dessas medidas: desvio médio, variância e desvio padrão. Para estudarmos o desvio médio, vamos considerar o quadro seguinte que nos mostra as notas de um aluno em matemática durante um ano letivo: Bimestre 1º 2º 3º 4º Notas 5 8 6 9 Vamos calcular a média aritmética desse aluno: x = 28 7 4 5 8 6 9 4 + + = = + Calcularemos, agora, as diferenças entre cada uma das notas e a média. Essas diferenças são chamadas de desvios para a média (xi − x ): 1 2 5 7 2 8 7 1 x x x x − = − = − − = − = 3 4 6 7 1 9 7 2 x x x x − = − = − − = − = A média aritmética dos valores absolutos dos desvios para a média é uma medida de dispersão chamada desvio médio, que se indica por dm 4 1 2 3 4 1 | | | | | | | | | 2 | |1| | 1| | 2 | 6 | x | 1,5 4 4 4 m i i x x x x x x x x d x = − + − + − + − − + + − + = − = = = = Agora considere uma outra situação na qual os dados se agrupam em uma distribuição de frequências. O quadro nos mostra a distribuição dos erros cometidos por 25 alunos numa prova de Biologia. Nessas condições, qual é o desvio médio dessa distribuição? Distribuição dos Erros de 25 alunos numa Prova de Biologia Nº de erros Nº de alunos fi 0 3 1 6 2 8 3 5 4 2 5 1 Fonte: ABC Calculando a média aritmética: 0.3 1.6 2.8 3.5 4.2 5.1 50 2 25 25 x + + + + + = = = Calculando ( ix x− ) 0 – 2 = - 2 2 – 2 = 0 4 – 2 = 2 1 – 2 = - 1 3 – 2 = 1 5 – 2 = 3 CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 22 Calculando o desvio médio: 2 .3 1 .6 0 .8 1 .5 2 .2 3 .1 24 0,96 25 25 md − + − + + + + = = = Quando os dados da distribuição estão agrupados a fórmula para o cálculo do desvio médio é: 1 1 . n i i i m n i i f x x d f = = − = Cálculo do Desvio médio com intervalos de classe Exemplo: Suponha que temos a seguinte tabela de frequências Classes fi 0 |---- 2 1 2 |---- 4 3 4 |---- 6 2 6 |---- 8 1 Para facilitar a aplicação da expressão do desvio médio, vamos criar algumas colunas auxiliares na nossa tabela de frequências, de modo que nossa nova tabela é dada por: Classes fi Ponto Médio ( )ix ( )i ix f | |ix x− | | .fi ix x− 0 |---- 2 1 1 1 2,86 2,86 2 |---- 4 3 3 9 0,86 2,58 4 |---- 6 2 5 10 1,14 2,28 6 |---- 8 1 7 7 3,14 3,14 Totais 7 27 10,86 As colunas auxiliares são, na verdade, organização do processo aritmético de cálculo da medida. Observe que para montar a 5ª coluna precisamos saber quanto vale a média aritmética. Para tanto podemos usar as colunas 4 e 2 para calcular. Nesse caso temos 27 3,86 7 x = = 10,86 1,55 7 md = = 3. Variância e Desvio Padrão O valor que corresponde à média aritmética dos quadrados dos desvios em relação à média recebe o nome de variância, valor esse que se indica por Va ou S 2 ou 2 . 2 1 1 .( ) n i i i a n i i f x x V f = = − = CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 23 Já a raiz quadrada da variância chama-se desvio padrão do conjunto de dados, valor que representamos por S ou . aS V= Exemplos: 1) A tabela a seguir mostra o número de votos por classe de dois candidatos que estão concorrendo a uma vaga de representante no conselho da escola. 2) Classe Candidato 3º A 3º B 3º C 3º D 3º E 3º F Vitor 12 15 12 16 14 15 Rafael 12 11 18 9 19 15 a) Calcule o desvio padrão de cada um desses candidatos. b) Qual dos dois candidatos é o mais regular? Solução: a) Inicialmente vamos calcular a média dos candidatos: 12 15 12 16 14 15 84 14 6 6 Vx + + + + + = = = 12 11 18 9 19 15 84 14 6 6 Rx + + + + + = = = Em seguida, vamos calcular os desvios e os quadrados dos desvios. Agora, vamos calcular as variâncias: 4 1 4 4 0 1 14 2,33 6 6 aVV + + + + + = = 4 9 16 25 25 1 80 13,33 6 6 aRV + + + + + = = Por último, vamos calcular os desvios padrões extraindo a raiz quadrada das variâncias: Rafael (xi - x ) (xi - x )2 12 − 14 = −2 (− 2) 2 = 4 11− 14 = −3 (− 3) 2 = 9 18 − 14 = 4 (4) 2 = 16 9 − 14 = −5 (− 5) 2 = 25 19 − 14 = 5 (5) 2 = 25 15 − 14 = 1 (1) 2 = 1 Vitor (xi - x ) (xi - x )2 12 − 14 = −2 (− 2) 2 = 4 15 − 14 = 1 (1) 2 = 1 12 − 14 = −2 (− 2) 2 = 4 16 − 14 = 2 (2) 2 = 4 14 − 14 = 0 (0) 2 = 0 15 − 14 = 1 (1) 2 = 1 CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 24 2,33 1,53 13,33 3,65 V aV R aR S V S V = = = = b) Observe que as médias de Vitor e Rafael são iguais a 14; Note também que Rafael tem um desvio padrão superior ao de Vitor, isto é, a dispersão dos votos relativamente à média é maior no caso de Rafael. Por isso, Vitor é o aluno mais regular. 2) Calcule a variância e o desvio padrão da seguinte distribuição: Distribuição de Valores de uma Padaria Classe fi [0; 4[ 2 [4;8[ 6 [8;12[ 8 [12;16[ 3 [16;20[ 1 Fonte: XYZ Solução: Neste caso, devemos construir um quadro mais complexo para calcular a média, os desvios em relação à média e seus quadrados Classe Ponto médio da classe ( ix ) if .i ix f ix x− 2( )ix x− [0; 4[ 2 2 4 2 − 9 = −7 49 [4;8[ 6 6 36 6 − 9 = −3 9 [8;12[ 10 8 80 10 − 9 = 1 1 [12;16[ 14 3 42 14 − 9 = 5 25 [16;20[ 18 1 18 18 − 9 = 9 81 20 180 - 165 Fonte: XYZ A média aritmética é: 180 9 20 x = = A variância é: 49.2 9.6 1.8 25.3 81.1 316 15,8 20 20 aV + + + + = = = O desvio padrão é: 15,8 3,97aS V= = 4. Coeficiente de Variação Na estatística descritiva o desvio padrão por si só tem grandes limitações. Assim, um desvio padrão de 2 unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato do desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando se deseja comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade, CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 25 quando expressas em unidades diferentes. Para contornar essas dificuldades e limitações, pode-se caracterizar a dispersão ou variabilidade dos dados em termos relativosao seu valor médio. Medida essa denominada de CV: Coeficiente de Variação. O coeficiente de variação é a razão entre o desvio padrão e a média. A fórmula do CV = .100 S x − O resultado neste caso é expresso em percentual, entretanto pode ser expresso também através de um fator decimal, desprezando assim o valor 100 da fórmula. Exemplo: Tomam-se os resultados das estaturas e dos pesos de um mesmo grupo de indivíduos: Qual das medidas (Estatura ou Peso) possui maior homogeneidade? Resposta: Tem-se que calcular o CV da Estatura e o CV do Peso. O CV menor será o de maior homogeneidade (menor dispersão ou variabilidade). CVestatura = (5 / 175) x 100 = 2,85 % CVpeso = (2 / 68) x 100 = 2,94 % Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os pesos. Propriedades das medidas de dispersão • Se somarmos ou subtrairmos um valor constante K a cada um dos elementos de um série, o desvio- padrão, desvio médio absoluto e a variância não se alterarão. • Se multiplicarmos ou dividirmos um valor constante K, a cada um dos elementos de um série, o desvio padrão e o desvio médio absoluto ficará multiplicado ou dividido pelo módulo dessa constante. • Se multiplicarmos ou dividirmos um valor constante K, a cada um dos elementos de um série, a variância ficará multiplicada ou dividida pelo quadrado dessa constante. • A unidade do desvio padrão e desvio médio absoluto é a mesma das variáveis a que eles são calculados. • A unidade da variância é o quadrado das variáveis a que ela é calculada. • O coeficiente de variação e a variância relativa são medidas adimensionais. Discriminação M É D I A DESVIO PADRÃO ESTATURAS 175 cm 5,0 cm PESOS 68 kg 2,0 kg CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 26 ATENÇÃO → TRABALHANDO COM DESVIOS EM AMOSTRAS O cálculo dos desvios para amostras é ligeiramente diferente do cálculo utilizado para populações. Basicamente, ocorre uma alteração nos denominadores, que envolvem o tamanho da população (n) e da amostra (n-1). Algumas alterações na nomenclatura também são usuais, observe no quadro a seguir: Note que ao trabalharmos com amostras, é comum denominarmos a variância por s2 e o desvio-padrão por s, ambos derivados do termo inglês sample (amostra). O fato de dividirmos por (n-1) na amostra, e não por n como na população, deve-se ao motivo de apenas (n-1) valores poderem ser associados a qualquer número, antes que o último valor possa ser determinado no cálculo individual das variâncias. A prática demonstra que a divisão por (n-1) faz o valor da variância amostral (s2) tender ao valor da variância populacional (σ2); caso a variância amostral fosse dividida por n, o valor da variância populacional ficaria subestimado. Exemplo: Suponha que o exemplo da Corretora Alpha de 140 clientes que contrataram seguro residencial seja uma amostra extraída do total de clientes de todos os tipos de seguro comercializado pela corretora. Vamos avaliar esses clientes, de acordo com a faixa salarial (em salários mínimos) de cada um deles, calculando a renda média (Média) e as dispersões em relação à média (Desvio-Médio, Desvio-Padrão e Coeficiente de Variação). CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 27 xi fi 5 |– 10 10 10 |– 15 17 15 |– 20 25 20 |– 25 35 25 |– 30 21 30 |– 35 18 35 |– 40 14 Total 140 Calculando a Média, o Desvio-Médio e o coeficiente de Variação • Média: • Desvio-Médio: • Coeficiente de Variação: De acordo com os resultados, a média salarial da amostra de clientes da corretora é de 22,86 salários mínimos, e o desvio-médio em relação a esse valor é 6,85 salários mínimos, o que representa uma dispersão dos dados observados em relação à média de 29,97%, de acordo com o coeficiente de variação. x i f i x i x f i i x – X i x – X f i i 5 |– 10 10 7,5 75 15,357 1 153,571 10 |– 15 17 12,5 212,5 10,357 1 176,0707 15 |– 20 25 17,5 437,5 5,3571 133,9275 20 |– 25 35 22,5 787,5 0,3571 12,4985 25 |– 30 21 27,5 577,5 4,6429 97,5009 30 |– 35 18 32,5 585 9,6429 173,5722 35 |– 40 14 37,5 525 14,642 9 205,0006 Total 140 – 3.200 – 952,1414 CENTRO UNIVERSITÁRIO CARIOCA ESTATÍSTICA Aulas de Estatística – Unidade II - Profº Wagner Xantre Tagarro 28 Calculando a Variância, o Desvio-Padrão e o Coeficiente de Variação x i f i x i x f i i ( x – X )2 i ( x – X )2 f i i 5 |– 10 10 7,5 75 235,8405 2.358,4052 10 |– 15 17 12,5 212,5 107,2695 1.823,5818 15 |– 20 25 17,5 437,5 28,69852 717,4630 20 |– 25 35 22,5 787,5 0,12752 4,4632 25 |– 30 21 27,5 577,5 21,55652 452,6869 30 |– 35 18 32,5 585 92,98552 1.673,7394 35 |– 40 14 37,5 525 214,4145 3.001,8033 Total 140 – 3.200 – 10.032,1429 • Variância: • Desvio-Padrão: • Coeficiente de Variação:
Compartilhar