Baixe o app para aproveitar ainda mais
Prévia do material em texto
� Medidas de localização, posição ou tendência central Medidas DescritivasMedidas Descritivas � Medidas de localização, posição ou tendência central � Medidas separatrizes � Medidas de variação ou dispersão � Medidas de formato 1 Medidas Medidas DescritivasDescritivas Objetivo Objetivo →→→→→→→→ reduzir um conjunto de dados numéricos a um pequeno grupo de valorespequeno grupo de valores que deve fornecerdeve fornecer toda a toda a informação relevanteinformação relevante a respeito desses dados �������� Existe uma grande variedade de medidas descritivas Como escolher a mais adequada? � Com que objetivo a medida está sendo obtida?Com que objetivo a medida está sendo obtida? informação relevanteinformação relevante a respeito desses dados 2 ��Existem valores atípicos que podem afetáExistem valores atípicos que podem afetá--la la exageradamente?exageradamente? � O propósito da análise é meramente descritivo O propósito da análise é meramente descritivo ou planejaou planeja--se fazer inferências?se fazer inferências? � Também denominadas medidas de tendência central ou medidas de posição. � Indicam um ponto central onde, geralmente, está Medidas de localizaçãoMedidas de localização � Indicam um ponto central onde, geralmente, está localizada a maioria das observações. 3 Medidas de localizaçãoMedidas de localização Objetivo Objetivo →→→→→→→→ representar o ponto de equilíbrioponto de equilíbrio ou o centrocentro ou o ponto de concentraçãoponto de concentração �� MédiaMédia aritméticaaritmética �� MedianaMediana o centrocentro ou o ponto de concentraçãoponto de concentração de uma distribuição Medidas de localização mais utilizadas: 4 �� MedianaMediana �� ModaModa �������� facilidade de cálculo e de compreensão Média aritméticaMédia aritmética Medida mais conhecida e utilizada: �������� propriedades matemáticas e estatísticas SimplesSimples→→→→→→→→ todos os valores participam do cálculo com o mesmo pesoMédia aritméticaMédia aritmética 5 PonderadaPonderada→→→→→→→→ com o mesmo peso pelo menos um dos valores participa com peso diferente Média aritméticaMédia aritmética Média aritmética simplesMédia aritmética simples Para um conjunto de nn valores: xi = x1, x2, ..., xn Quando falarmos simplesmente média – é dela que estamos falando =x xi = x1, x2, ..., xn soma de todos os valoressoma de todos os valores total de valores somadostotal de valores somados Exemplo:Exemplo: n ∑ ix 6 X = tempo para realizar uma tarefa (min) xi = 4, 5, 7, 9, 10 7 5 35 5 109754 x == ++++ = min Média aritmética ponderadaMédia aritmética ponderada Temos um conjunto de valores e um conjunto de pesos: xi = x1, x2, ..., xn pii = p1, p2, ..., pn =px pii = p1, p2, ..., pn soma de produtos de valores e pesossoma de produtos de valores e pesos Exemplo:Exemplo: soma dos pesossoma dos pesos∑ ip ∑ ii p x 7 X = nota xii = 7, 8, 6, 10 pii = 2, 2, 1, 1 1122 110162827 xp +++ ×+×+×+× = 7,67 6 46 xp == Propriedades da média aritméticaPropriedades da média aritmética 11aa propriedadepropriedade:: A média de um conjunto de dados que não varia, ou seja, cujos valores são uma constante, é anão varia, ou seja, cujos valores são uma constante, é a própria constante. 7 7, 7, 7, 7,xi = Verificação numérica:Verificação numérica: 8 7x = 22aa propriedade:propriedade: Ao somar uma constante c por todos os valores de um conjunto de dados, sua média também é somada por esta constante. xi = 4, 5, 7, 9, 10 7x = x+2 = 6, 7, 9, 11, 12 Somar c=2Somar c=2 Verificação numérica:Verificação numérica: 9 xi+2 = 6, 7, 9, 11, 12 n 2)(x x i2x ∑ + =+ 95 45 5 1211976 == ++++ = cxx 27x cx 2x += += + + 33aa propriedade:propriedade: Ao multiplicar uma constante c por todos os valores de um conjunto de dados, sua média também é multiplicada por esta constante. xi = 4, 5, 7, 9, 10 7x = Verificação numérica:Verificação numérica: Multiplicar por c=2Multiplicar por c=2 10 2xi = 8, 10, 14, 18, 20 n 2x x i2x ∑ = 145 70 5 201814108 == ++++ = xcx 72x cx 2x = ×= 44aa propriedadepropriedade:: A soma de todos os desvios em relação à média de um conjunto de valores é nula. ∑ =− 0)x(xi desviodesviodesviodesvio diferença entre a observação e a média aritméticadiferença entre a observação e a média aritmética Verificação numérica:Verificação numérica: =−74 --33 11 xi = 4, 5, 7, 9, 10 7x = =−75 =−77 =−79 =−710 )x(xi − --22 00 22 33 SOMA = 0 55aa propriedadepropriedade:: A soma dos quadrados dos desvios em relação a uma constante c é mínima quando c = .x ∑ − 2 i c)(x é mínima quando c =é mínima quando c = x 7x = i xi 2i )x(x − 2i 5)(x − 2i 10)(x − 1 4 2 5 9 4 1 0 36 25 Verificação numérica:Verificação numérica: 12 2 5 3 7 4 9 5 10 Σ 35 4 0 4 9 26 0 4 16 25 46 25 9 1 0 71 ÉÉ aa medidamedida queque dividedivide umum conjuntoconjunto dede dadosdados ordenadoordenado emem duasduas partespartes iguaisiguais:: 5050%% dosdos valoresvalores Mediana (Md)Mediana (Md) ficamficam abaixoabaixo ee 5050%% ficamficam acimaacima dada medianamediana.. MdMd 50% 50%xx(1)(1) xx(n)(n) 13 Para obter a mediana: 1.1. Ordenar os dados 2.2. Determinar a posição (p) da mediana Dois casos: n ímparn ímpar →→→→→→→→ um valor central 2.2. Determinar a posição (p) da mediana n parn par →→→→→→→→ dois valores centrais posiçãoposição 2 1np +=→→→→→→→→ Md = x(p) 14 posiçõesposições 1 2(p ) (p ) x +x Md= 22 1np += p1 p2 XX = Tempo para realizar uma tarefa (min)= Tempo para realizar uma tarefa (min) xxii = 5, 9, 7, 4, 12, 10= 5, 9, 7, 4, 12, 10 Exemplo:Exemplo: 1.1. Ordenar os dados n = 6 (par) 1.1. Ordenar os dados x(i) = 4, 5, 7, 9, 10, 12 2.2. Determinar a posição (p) da mediana p =3 15 2 1np += 3,5 2 16 = + = 2 xx Md (4)(3) + = 82 97 = + = min 8Md = p1=3 p2=4 Moda (Mo)Moda (Mo) �������� É o valor de maior ocorrênciamaior ocorrência num conjunto de dados. �������� É a única medida que pode não existirpode não existir e, existindo, �������� É a única medida que pode não existirpode não existir e, existindo, pode não ser únicapode não ser única. XX = Tempo para realizar uma tarefa (min)= Tempo para realizar uma tarefa (min) MoMo = 8 min= 8 minxi = 12, 8, 7, 5, 7, 4, 8, 8, 9 Exemplos:Exemplos: 16 xi = 9, 5, 4, 5, 7, 1, 2, 2 xi = 5, 7, 3, 7, 9, 5, 9, 3 não existenão existe MoMo (conjunto amodal) MoMo = 2 = 2 ee 5 min5 min (conjunto bimodal) Os valores que seguem são os tempos (em segundos) de reação a um alarme de incêndio, após a liberação de fumaça de uma fonte fixa: Exercício proposto:Exercício proposto: de uma fonte fixa: Para este conjunto de valores, calcule as medidas de posição (média, mediana e moda). 12 9 11 7 9 14 6 10 17 posição (média, mediana e moda). = 9,75 Md = 9,5 Mo = 9 X � No cálculo da média participam todos os valores observados. � É uma medida de fácil interpretação e presta-se muito bem Média aritmética Média aritmética -- característicascaracterísticas � É uma medida de fácil interpretação e presta-se muito bem a tratamentos estatísticos adicionais. � É uma medida que sempre existe e é única. � É o ponto de equilíbrio de uma distribuição, sendo tão mais eficiente quanto mais simétrica for a distribuição dos 18 valores ao seu redor. � Desvantagem: � É uma medida altamente influenciada por valores atípicos ou discrepantes (não resistente).4 5 7 9 104 5 7 9 10 =x =Md 77 77 4 5 7 9 154 5 7 9 15 =x 88 88 77=Md 19 4 5 7 9 254 5 7 9 25 =x 1010 1010 77=Md � Define exatamente o centro de uma distribuição, mesmo quando os valores se distribuem assimetricamente em torno da média. Mediana Mediana -- característicascaracterísticas da média. � Pode ser determinada mesmo quando não se conhece todos os valores do conjunto de dados. � É uma medida que sempre existe e é única. � É uma medida resistente, ou seja, não sofre influência de 20 valores discrepantes. Desvantagem: � É uma medida que não se presta a cálculos matemáticos. � É uma medida que têm existência real dentro do conjunto de dados e em grande número de vezes. Moda Moda -- característicascaracterísticas � Não exige cálculo, apenas uma contagem. � Pode ser determinada também para variáveis categóricas. � Desvantagem: 21 � Desvantagem: � É uma medida que não se presta a cálculos matemáticos. � Deixa sem representação todos os valores do conjunto de dados que não forem iguais a ela. MÉDIA ARITMÉTICA MEDIANA MODA Objetivo Objetivo Objetivo Frequentemente usada para operações estatísticas mais avançadas. Eventualmente pode ser usada para operações estatísticas mais avançadas ou para separar distribuições em duas categorias (alta versus baixa) Medida de tendência central rápida, simples, mas um tanto grosseira. Forma da distribuição Forma da distribuição Forma da distribuição Mais apropriada para simetria e unimodal. Mais apropriada para assimetria acentuada. Mais apropriada para bimodal. Nível de mensuração Nível de mensuração Nível de mensuração Intervalar ou racional Ordinal, intervalar ou racional Nominal, ordinal, intervalar ou racional Vantagens Vantagens Vantagens - No cálculo da média participam todos os valores observados. - É uma medida de fácil interpretação e presta-se muito bem a tratamentos estatísticos adicionais. - É uma medida que sempre existe e é rígida e unicamente determinada. - É um valor típico de um conjunto de dados, podendo substituir todos os valores de um - Define exatamente o centro de uma distribuição, mesmo quando os valores se distribuem assimetricamente em torno da média. - Pode ser determinada mesmo quando não se conhece todos os valores do conjunto de dados. - É uma medida que sempre existe e é única. - Esta medida pode ser utilizada para definir o meio de um número de objetos, propriedades ou - É uma medida que têm existência real dentro do conjunto de dados e em grande número de vezes. - Não exige cálculo, apenas uma contagem. - Pode ser determinada também para variáveis qualitativas nominais. 22 podendo substituir todos os valores de um conjunto sem alterar o total. - É o ponto de equilíbrio de uma distribuição, sendo tão mais eficiente quanto mais simétrica for a distribuição dos valores ao seu redor. meio de um número de objetos, propriedades ou qualidades que possam de alguma forma ser ordenados. - É uma medida resistente, ou seja, não sofre influência de valores discrepantes. Desvantagem Desvantagem Desvantagens - É uma medida altamente influenciada por valores discrepantes (não resistente). - É uma medida que não se presta a cálculos matemáticos. - É uma medida que não se presta a cálculos matemáticos. - Deixa sem representação todos os valores do conjunto de dados que não forem iguais a ela. Medidas separatrizesMedidas separatrizes �������� Indicam limites para proporções de observações em um Indicam limites para proporções de observações em um conjuntoconjunto QuartisQuartis→→→→→→→→ dividem o conjunto ordenado ordenado em quatroquatro partes Decis Decis →→→→→→→→ dividem o conjunto ordenadoordenado em dezdez partes Mediana Mediana →→→→→→→→ divide o conjunto ordenadoordenado em duasduas partes conjuntoconjunto 23 Percentis Percentis →→→→→→→→ dividem o conjunto ordenadoordenado em cemcem partes �������� São três medidas que dividem um conjunto de dados São três medidas que dividem um conjunto de dados ordenado em quatro partes iguais. ordenado em quatro partes iguais. Quartis (QQuartis (Qii)) MdMd25% QQ11 25% QQ22 25% 25% QQ33 xx(1)(1) xx(n)(n) 24 Primeiro quartil Primeiro quartil (Q(Q11):): 25% dos valores abaixo e 75% acima dele25% dos valores abaixo e 75% acima dele Segundo quartil Segundo quartil (Q(Q22):): 50% dos valores abaixo e 50% acima dele50% dos valores abaixo e 50% acima dele Terceiro quartil Terceiro quartil (Q(Q33):): 75% dos valores abaixo e 25% acima dele75% dos valores abaixo e 25% acima dele Para obter os quartis: 1.1. Ordenar os dados 2.2. Determinar a posição (pp) de cada quartil Dois casos: n ímparn ímpar n parn par 4 1np1 + =Posição do QPosição do Q1 1 →→→→→→→→ 4 2np1 + =Posição do QPosição do Q1 1 →→→→→→→→ 25 4 1)2(np2 +=Posição do QPosição do Q2 2 →→→→→→→→ 4 1)3(np3 +=Posição do QPosição do Q3 3 →→→→→→→→ 4 22np2 + =Posição do QPosição do Q2 2 →→→→→→→→ 4 23np3 + =Posição do QPosição do Q3 3 →→→→→→→→ i i (p )Q x= Se pp não for inteiro, tomamos os dois inteiros mais próximos. 7,5pi =Exemplo:Exemplo: 77 88 xx + O quartil será a média O quartil será a média 26 2 xxQ (8)(7)i + = O quartil será a média O quartil será a média aritmética dos dois valores que aritmética dos dois valores que ocupam essas duas posições.ocupam essas duas posições. Foram registrados os tempos de frenagem para 21 motoristas que dirigiam a 30 milhas por hora. Os valores obtidos foram: Exercício proposto: Exercício proposto: 69 58 70 80 46 61 65 74 75 55 67 56 70 72 61 66 58 68 70 68 58 Para o conjunto de valores, calcule os quartis e interprete esses valores. 46 55 56 58 58 58 61 61 65 66 67 27 Q1 = 58 Q2 = 67 Q3 = 70 46 55 56 58 58 58 61 61 65 66 67 68 68 69 70 70 70 72 74 75 80 i xi yi zi Medidas de variação ou dispersãoMedidas de variação ou dispersão 1 4 2 1 2 4 5 8 3 4 4 5 4 4 6 4 5 4 3 2 Σ 20 20 20 28 Σ 44 44 44MédiaMédia Medidas de variação ou dispersãoMedidas de variação ou dispersão Objetivo Objetivo →→→→→→→→ indicar quanto os valores diferem entrediferem entre si ou quanto eles se afastam da médiase afastam da média �� Amplitude Amplitude totaltotal �� VariânciaVariância si ou quanto eles se afastam da médiase afastam da média Medidas de variação mais utilizadas: �������� Complementam as medidas de tendência central 29 �� VariânciaVariância �� Desvio padrãoDesvio padrão �� Coeficiente de variaçãoCoeficiente de variação Tendo a cabeça a arder e os pés enterrados no gelo, na média está tudo bem! Amplitude total (aAmplitude total (att)) �������� Fornece uma ideia inicial de variação �������� É obtida pela diferença entre o maiormaior valorvalor e o menormenor valorvalor de um conjunto de dados aatt EIESa −= EI=xEI=x(1)(1) ES=xES=x(n)(n) 30 (1)(n)t xxa −= EIESat −= ESES:: extremo superior do conjunto de dados ordenado EIEI:: extremo inferior do conjunto de dados ordenado Exemplo:Exemplo: min9312 =−=EIESa −= X = Tempo para realizar uma tarefa (min) xi = 3, 3, 4, 6, 7, 9, 9, 11, 12 min9312 =−=EIESat −= Significado:Significado: todos os valores do conjunto de dados diferem, todos os valores do conjunto de dados diferem, EIEI ESES100%100% 31 Significado:Significado: todos os valores do conjuntode dados diferem, todos os valores do conjunto de dados diferem, no máximo, em 9 minutosno máximo, em 9 minutos DesvantagensDesvantagens �������� extremamente influenciada por valores discrepantesextremamente influenciada por valores discrepantes �������� pouco precisapouco precisa i xi yi zi 1 4 2 1 2 4 5 8 3 4 4 5 4 4 6 4 5 4 3 2 Σ 20 20 20 Média 4 4 4 32 Média 4 4 4 aatt 00 44 77 �������� Medida de variação mais utilizada: �������� facilidade de compreensãofacilidade de compreensão �������� propriedades estatísticas importantes para a propriedades estatísticas importantes para a Variância Variância ((ss22)) �������� propriedades estatísticas importantes para a propriedades estatísticas importantes para a inferênciainferência �������� Considera o desvio da média como unidade básicaunidade básica da variação: �������� Leva em conta todos os valores do conjunto de dados 33 mede quanto cada valor mede quanto cada valor varia em relação à médiavaria em relação à média da variação: )x(xi −Desvio: =−74 xi = 4, 5, 7, 9, 10 Exemplo:Exemplo: =−75 7x = --33 --22=−75 =−77 =−79 =−710 variação do xvariação do xii em em relação à médiarelação à média)x(xi − --22 00 22 33 Média dos desvios Média dos desvios →→→→→→→→ variação média do conjunto de valoresvariação média do conjunto de valores 34 0=∑ − )x(xisoma de todos os desviossoma de todos os desvios número de desvios somadosnúmero de desvios somados n 44aa propriedadepropriedade dada médiamédia →→→→→→→→ ∑ =− 0)x(xi Solução:Solução: elevar os desvios ao quadradoelevar os desvios ao quadrado →→→→→→→→ desvios negativos ficam positivos e podem ser somados ∑ − 2 i )x(xsoma dos quadrados dos desviossoma dos quadrados dos desvios Média dos Média dos número de desvios somadosnúmero de desvios somados ∑ −i )x(x n soma dos quadrados dos desviossoma dos quadrados dos desvios Média dos Média dos quadrados quadrados dos desviosdos desvios 35 1-n )x(x s 2 i2 ∑ − = número de graus de liberdade número de graus de liberdade ou desvios independentesou desvios independentes Porque este denominador confere à variância melhores propriedades estatísticas (importante na inferência estatística). Por que utilizar nPor que utilizar n--1 como denominador?1 como denominador? �������� Quando o objetivo for apenas descrever a variação de descrever a variação de n )x(x s 2 i2 n ∑ − = �������� Quando o objetivo for apenas descrever a variação de descrever a variação de um conjunto de valoresum conjunto de valores, podemos usar o denominador nn. �������� Quando o objetivo for estimar a variação de uma estimar a variação de uma 36 1-n )x(x s 2 i2 ∑ − = �������� Quando o objetivo for estimar a variação de uma estimar a variação de uma populaçãopopulação por meio da variação de um conjunto de valores (amostra), devemosdevemos usar o denominador nn--11. X = tempo para realizar uma tarefa (min) xi = 4, 5, 7, 9, 10 Exemplo:Exemplo: min7x = 1n )x(x s 2 i2 − − = ∑ 15 7)(107)(97)(77)(57)(4 22222 − −+−+−+−+− = 37 6,5 4 26 4 94049 == ++++ = 22 min6,5s = unidade de medida fica unidade de medida fica elevada ao quadradoelevada ao quadrado Propriedades da variânciaPropriedades da variância 11aa propriedade:propriedade: A variância de um conjunto de dados que não varia, ou seja, cujos valores são uma constante, é zero. Verificação numérica:Verificação numérica: xi = 7, 7, 7, 7, 7 0 15 7)(77)(77)(77)(77)(7 s 22222 2 = − −+−+−+−+− = 7x= Verificação numérica:Verificação numérica: 38 15− 2 2 c c c s 0 n 1 ( )− = = − ∑ 22aa propriedade:propriedade: Ao somar uma constante cc a todos os valores de um conjunto de dados, a variância destes dados não se altera. x = 4, 5, 7, 9, 10 7x= Verificação numérica:Verificação numérica: xi = 4, 5, 7, 9, 10 xi+2 = 6, 7, 9, 11, 12 Somar c=2Somar c=2 6,5s2 = 9x 2x =+ cxx cx +=+→→→→→→→→ 22 cx ss =+6,5s2 2x =+ →→→→→→→→ 39 2min 6,5 4 26 4 94049 == ++++ = 15 9)(129)(119)(99)(79)(6 s 22222 2 2x − −+−+−+−+− =+ 33aa propriedadepropriedade:: Ao multiplicar todos os valores de um conjunto de dados por uma constante cc, a variância destes dados fica multiplicada pelo quadrado desta constante. 7x= Verificação numérica:Verificação numérica: xi = 4, 5, 7, 9, 10 Multiplicar por c=2Multiplicar por c=2 6,5s2 = 7x= 2xi= 8, 10, 14, 18, 20 14x2x = →→→→→→→→ xcxcx = 26s22x = 222 xc scs =→→→→→→→→ 40 2min 26 4 104 4 361601636 == ++++ = 15 14)(2014)(1814)(1414)(1014)(8 s 22222 2 2x − −+−+−+−+− = 6,522 ×= Trabalhando com a expressão da variância, é possível encontrar uma fórmula mais prática de cálculo: 1n x nx s 22 2 i − − = ∑ 41 Desvantagens da variância:Desvantagens da variância: 1.1. Como a variância é calculada a partir da média, é uma medida pouco resistentepouco resistente, ou seja, muito influenciada por valores atípicos. 2.2. Como a unidade de medida fica elevada ao quadrado, a interpretação da variância se torna a interpretação da variância se torna mais difícilmais difícil. muito influenciada por valores atípicos. 42 Para solucionar o problema de interpretação da variância surge outra medida: o desvio padrãodesvio padrão. Desvio padrão (s)Desvio padrão (s) �������� É definido como a raiz quadrada positiva da raiz quadrada positiva da variânciavariância X = tempo para realizar uma tarefa (min) 2ss = Exemplo:Exemplo: variânciavariância 2ss = 43 xi = 4, 5, 7, 9, 10 22 min 6,5s = min 7x = 2ss = 2min 6,5s = min 2,55s = 2,557± sx ± Apresentação do desvio padrão:Apresentação do desvio padrão: Tempo médio para realizar a Tempo médio para realizar a 2,557± tarefa de 7 minutos com uma tarefa de 7 minutos com uma variação média de 2,55 minutos variação média de 2,55 minutos acima e abaixo da média.acima e abaixo da média. Significado:Significado: variação média em torno da média aritméticavariação média em torno da média aritmética 44 ATENÇÃO:ATENÇÃO: ver propriedades da variância e quais as ver propriedades da variância e quais as adaptações necessárias para o desvio padrão!adaptações necessárias para o desvio padrão! Interpretação do Desvio PadrãoInterpretação do Desvio Padrão O desvio padrão é uma forma de medir distância entre as observações de um conjunto de dados em relação a sua média. Exemplo:Exemplo: Podemos comparar 85 em um exame de inglês com 80 em um exame de alemão? Que nota é realmente mais alta? Um raciocínio rápido mostra que isso depende do desempenho 45 Um raciocínio rápido mostra que isso depende do desempenho dos outros estudantes em cada turma, ou seja, da variabilidade das notas – do desvio padrão. Esse mesmo raciocínio de comparação de escores em provas é utilizado nos concursos vestibulares. Coeficiente de Variação (CV)Coeficiente de Variação (CV) O coeficiente de variação é definido como a proporção a proporção (ou percentual) da média representada pelo desvio (ou percentual) da média representada pelo desvio padrãopadrão. s = �������� 100% x sCV = X = tempo para realizar uma tarefa (min) xi = 4, 5, 7, 9, 10 min 7x = Exemplo:Exemplo: 46 xi = 4, 5, 7, 9, 10 min 2,55s = 100% x sCV = 100% min 7 min 2,55 = 36,4% = O CV é a medida mais utilizada para comparar comparar variabilidadesvariabilidades de diferentes conjuntos de dados �������� �������� Esta comparação não deve ser feita através de qualquer não deve ser feita através de qualquer medida de variaçãomedida de variaçãoem duas situações: �������� quandoquando asas médiasmédias dosdos conjuntosconjuntos comparadoscomparados sãosão Vantagens:Vantagens: �������� quandoquando asas médiasmédias dosdos conjuntosconjuntos comparadoscomparados sãosão muitomuito desiguaisdesiguais �������� quandoquando asas unidadesunidades dede medidamedida sãosão diferentesdiferentes NessasNessas situaçõessituações devemosdevemos usarusar oo CVCV. 47 �������� O CV é desprovido de unidade de medidadesprovido de unidade de medida (expresso em percentagem) �������� O CV é uma medida relativamedida relativa, pois relaciona o desvio padrão com a sua respectiva média aritmética Consideremos que x1i e x2i são conjuntos de valores referentes aos salários (R$) de mulheres e homens salários (R$) de mulheres e homens , para os quais foram obtidas as seguintes medidas: Exemplo:Exemplo: 48 Mulheres Mulheres (X(X11):): Homens Homens (X(X22):):1.300x1 = s1 = 340 2.500x2 = s2 = 420 Qual grupo varia mais em relação aos salários?Qual grupo varia mais em relação aos salários? 1300x1 = 2500x2 = CV1 = 26,2% O maior desvio padrão, quando comparado à O maior desvio padrão, quando comparado à s1 = 340 CV2 = 16,8% s2 = 420 49 O maior desvio padrão, quando comparado à O maior desvio padrão, quando comparado à sua média, representou menor variação.sua média, representou menor variação. Quando as médias são diferentes, devemos usar o CV.Quando as médias são diferentes, devemos usar o CV. Contou-se o número de vendas de determinado produto durante os sete dias de uma semana, com os seguintes resultados: 14 20 20 20 15 16 18 Exercício proposto:Exercício proposto: 14 20 20 20 15 16 18 a) Determine a média, a mediana e a moda. b) Calcule a variância, o desvio padrão e o coeficiente de variação. média = 17,6 50 mediana = 18 moda = 20 variância = 6,62 desvio padrão = 2,57 CV = 14,64% O formato é um aspecto importante de uma distribuição. Está relacionado com as ideias de simetriasimetria e curtosecurtose. A simetriasimetria em torno de um eixo indica que o formato da Medidas de FormatoMedidas de Formato �������� �������� A simetriasimetria em torno de um eixo indica que o formato da distribuição à esquerda e à direita desse eixo é o mesmo. A curtosecurtose está relacionada com o grau de concentração das observações no centro e nas caudas da distribuição. �������� �������� 51 caudacaudacaudacauda caudacauda centrocentro Informa se a maioria dos valores se localiza à esquerda, ou à direita, ou se estão distribuídos uniformemente em torno da média aritmética. Coeficiente de AssimetriaCoeficiente de Assimetria �������� 3ma = da média aritmética. O coeficiente de coeficiente de assimetriaassimetria é calculado a partir do segundosegundo e do terceiroterceiro momentos centrados na médiamomentos centrados na média: �������� n )x(x m 3 i 3 ∑ − = 52 22 3 3 mm a = Indica o graugrau e o sentidosentido do afastamento da simetria.�������� n )x(x m 2 i 2 ∑ − = Se aa33==00, a distribuição é classificada como simétricasimétrica, indicando que os valores estão uniformemente distribuídos em torno da média. Classificação quanto à simetriaClassificação quanto à simetria distribuídos em torno da média. 53 MoMdx == Se aa33>>00, a distribuição é classificada como assimétricaassimétrica positivapositiva, indicando que a maioria dos valores são menores ou se localizam à esquerda da média (cauda para direita). 54 xMdMo << Se aa33<<00, a distribuição é classificada como assimétrica assimétrica negativanegativa, indicando que a maioria dos valores são maiores ou se localizam à direita da média (cauda para esquerda). 55 MoMdx << Indica o grau de achatamento de uma distribuição. O coeficiente de curtosecoeficiente de curtose é calculado a partir do Coeficiente de CurtoseCoeficiente de Curtose �������� �������� 2 2 4 4 m m a = O coeficiente de curtosecoeficiente de curtose é calculado a partir do segundo e do quarto momentos centrados na médiasegundo e do quarto momentos centrados na média. �������� )x(x 2∑ − n )x(x m 4 i 4 ∑ − = 56 2m A classificação é feita tendo por base a curtosecurtose que ocorre na distribuição normaldistribuição normal. �������� n )x(x m 2 i 2 ∑ − = Classificação quanto à curtoseClassificação quanto à curtose aa44<<3 3 ⇒ platicúrtica ⇒ baixa concentração de valores no centro, tornando a distribuição mais achatada que a distribuição normal.distribuição normal. aa44==33⇒ mesocúrtica⇒ concentração das observações ocorre de forma semelhante à da distribuição normal. aa44>>3 3 ⇒ leptocúrtica ⇒ alta concentração de valores no centro, o que provoca um pico maior que o da distribuição normal. 57 Platicúrtica Mesocúrtica Leptocúrtica Medidas Medidas DescritivasDescritivas Dados não agrupadosDados não agrupados Dados agrupados em classeDados agrupados em classe 3,11 8,88 9,26 10,81 12,69 (medidas exatas)(medidas exatas) (medidas aproximadas)(medidas aproximadas) j Classes jF 1 3,11 | 16,00 8 2 16,00 | 28,89 20 3 28,89 | 41,78 6 4 41,78 | 54,67 8 5 54,67 | 67,56 3 3,11 8,88 9,26 10,81 12,69 13,78 15,23 15,62 17,00 17,39 18,36 18,43 19,27 19,50 19,54 20,16 20,59 22,22 23,04 24,47 24,58 25,13 26,24 26,26 27,65 28,06 28,08 28,38 32,03 36,37 38,98 38,64 39,16 41,02 42,97 44,08 44,67 45,40 46,69 48,65 58 5 54,67 | 67,56 3 6 67,56 | 80,45 1 7 80,45 | | 93,34 4 Σ 50 44,08 44,67 45,40 46,69 48,65 50,39 52,75 54,80 59,07 61,22 70,32 82,70 85,76 86,37 93,34 Dados agrupados em classeDados agrupados em classeDados não agrupadosDados não agrupados j Classes jc jF 1 3,11 | 16,00 9,555 8 PressuposiçãoPressuposição Medidas para dados agrupados em classeMedidas para dados agrupados em classe 1 3,11 | 16,00 9,555 8 2 16,00 | 28,89 22,445 20 3 28,89 | 41,78 35,335 6 4 41,78 | 54,67 48,225 8 5 54,67 | 67,56 61,115 3 6 67,56 | 80,45 74,005 1 7 80,45 | | 93,34 86,895 4 59 7 80,45 | | 93,34 86,895 4 Σ − 50 n x x i∑= ←←←←←←←← nnão estão disponíveisão estão disponíveis Distribuição simétrica Distribuição simétrica dentro dos intervalosdentro dos intervalos j Classes jc jF jc jF 1 3,11 | 16,00 9,555 8 2 16,00 | 28,89 22,445 20 9,555 x 8 = 76,44 22,445 x 20 = 448,90 MédiaMédia 2 16,00 | 28,89 22,445 20 3 28,89 | 41,78 35,335 6 4 41,78 | 54,67 48,225 8 5 54,67 | 67,56 61,115 3 6 67,56 | 80,45 74,005 1 7 80,45 | | 93,34 86,895 4 Σ − 50 22,445 x 20 = 448,90 35,335 x 6 = 212,01 ∑ Fc 48,225 x 8 = 385,80 61,115 x 3 = 183,345 74,005 x 1 = 74,005 86,895 x 4 = 347,58 = 1.728,08 60 Σ − 50 n Fc x jj∑= ∑ jjFc Média aritmética:Média aritmética: = 1.728,08 = = 1728,08 34,56 reais 50 gasto no supermercado j Classes jc jF jF′ jc jF 1 3,11 | 16,00 9,555 8 8 76,44 2 16,00 | 28,89 22,445 20 28 448,90 3 28,89 | 41,78 35,335 6 34 212,01 Classe modalClasse modal Classe medianaClasse mediana Mediana e ModaMediana e Moda 3 28,89 | 41,78 35,335 6 34 212,01 4 41,78 | 54,67 48,225 8 42 385,80 5 54,67 | 67,56 61,115 3 45 183,35 6 67,56 | 80,45 74,005 1 46 74,01 7 80,45 || 93,34 86,895 4 50 347,58 Σ − 50 − 1.728,08 Classe modalClasse modal 61 Posição da Mediana Posição da Mediana →→→→→→→→ += =n 1p 25,5 2 25 26 Classe modal: Classe modal: classe com a maiorfrequência absoluta Classe mediana:Classe mediana: classe que compreende a mediana j Classes jc jF 2jj )( xcF − 1 3,11 | 16,00 9,555 8 8 (9,555- 34,56)2 = 5.002,00 reais34,56x = VariânciaVariância 1 3,11 | 16,00 9,555 8 2 16,00 | 28,89 22,445 20 3 28,89 | 41,78 35,335 6 4 41,78 | 54,67 48,225 8 5 54,67 | 67,56 61,115 3 6 67,56 | 80,45 74,005 1 7 8 (9,555- 34,56) = 5.002,00 20 (22,445- 34,56)2 = 2.935,46 6 (35,335- 34,56)2 = 3,60 62 7 80,45 || 93,34 86,895 4 Σ − 50 Variância:Variância: ( )∑ − 2jj xcF 24.062,15 ( ) 1n xcF s 2 jj2 − − = ∑ ( ) 22jj2 reais491,06 49 24062,15 1n xcF s == − − = ∑ 2 === reais22,16491,06ss 2 === reais 22,1634,56 sx ± ± 63 64,12%100% 34,56 22,16100% x sCV === DDaaddooss nnããoo aaggrruuppaaddooss DDaaddooss aaggrruuppaaddooss eemm ccllaassssee x = 34,78 reais x = 34,56 reais Md = 27,31 reais Classe mediana: [16,00 ; 28,89) Md = 27,31 reais Classe mediana: [16,00 ; 28,89) Mo não existe Classe modal: [16,00 ; 28,89) s2 = 471,32 reais 2 s2 = 491,06 reais2 s = 21,71 reais s = 22,16 reais 64 s = 21,71 reais s = 22,16 reais CV = 62,42% CV = 64,12% Exercício proposto:Exercício proposto: Calcule as medidas descritivas para o conjunto de dados referente ao número de pães não vendidos em uma certa padaria até a hora do encerramento do expediente. j Classes Fj 1 0 20 2 1 7 3 2 7 4 3 3 5 4 2 65 5 4 2 6 5 1 ∑ 40 Solução: j Classes Fj Fj´ cjFj Fj(cj-xp)2 1 0 20 20 0 23,11 2 1 7 27 7 0,04 3 2 7 34 14 5,99 média = 1,075 moda = 0 Assimétrica positiva 2 7 34 14 5,99 4 3 3 37 9 11,12 5 4 2 39 8 17,11 6 5 1 40 5 15,41 ∑ 40 - 43 72,78 66 moda = 0 Assimétrica positiva mediana = 0,5 Variância = 1,87 Desvio padrão = 1,37 CV = 127,07
Compartilhar