Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Características Numéricas de uma Distribuição de Dados Medidas de tendência central ou de posição Medidas de dispersão ou variabilidade Introdução 2 As vezes é necessário resumir certas características das distribuições de dados (ou mesmo de frequências de dados) por meio de certas quantidades. Tais quantidades são usualmente denominadas de MEDIDAS, por quantificarem alguns aspectos de nosso interesse. Nosso objetivo é apresentar algumas das chamadas MEDIDAS DE POSIÇÃO, bem como, algumas MEDIDAS DE DISPERSÃO, consideradas mais importantes no campo da aplicabilidade prática do nosso dia a dia. Tais medidas servem para: (a) Localizar uma distribuição; (b) Caracterizar sua variabilidade. Medidas de Posição (ou de Tendência Central) 3 Servem para localizar a distribuição dos dados brutos (das frequências) sobre o eixo de variação da variável em questão. Veremos os três tipos principais de medidas de posição: (a) Média Aritmética; (b) Mediana; (c) Moda. Medidas de Posição (ou de Tendência Central) n fX ii k i 1ˆX 4 Média (Aritmética) A notação internacional recomenda símbolos específicos para a Média: n X i n i 1ˆX (a) Amostra: Conjunto de Dados => Tabelas de Frequência => => Medidas de Posição (ou de Tendência Central) N fX μ ii k i 1 N X μ i N i 1 5 Média (Aritmética) Conjunto de Dados => Tabela de Frequência => (b) POPULAÇÃO: Medidas de Posição (ou de Tendência Central) seg n fPm n fX ii k i ii k i 5,54 50 725.2 X ˆX 1 1 6 Exemplo: Tempo (em segundos) gasto por um funcionário Cálculo da média Classes xi fi Pmifi 40 45 42 3 126 45 50 47 8 376 50 55 52 16 832 55 60 57 12 684 60 65 62 7 434 65 70 67 3 201 70 75 72 1 72 50 2.725 2 Medidas de Posição (ou de Tendência Central) 7 Propriedades da Média (a) Multiplicando todos os valores de uma variável por uma constante, a média do conjunto fica multiplicada por essa constante. (b) Somando-se ou subtraindo-se uma constante a todos os valores da variável, a média do conjunto fica acrescida ou subtraída dessa constante. Medidas de Posição (ou de Tendência Central) 8 Mediana A mediana é uma quantidade que, como a média, também caracteriza o centro de uma distribuição pertencente a um conjunto de dados. dmˆ (a) Amostra: (b) População: => md Medidas de Posição (ou de Tendência Central) 1 2 n 9 Conjunto de Dados: Para obtenção da estimativa de mediana de um conjunto de dados são necessários os seguintes passos: 1º Passo: Ordenar de forma crescente os “n” valores da variável em questão; 2º Passo: (i) Sendo “n” ímpar, a mediana será igual ao valor de ordem ; 2 )1( n (ii) Sendo “n” par, a mediana será o valor médio entre os valores de ordem e . 2 n Medidas de Posição (ou de Tendência Central) h f F n Ldm md a i . 2 ˆ 10 Tabelas de Frequência => Li = limite inferior da classe que contém a mediana; n = números de elementos do conjunto da dados; Fa = soma das frequências das classes anteriores que fmd = frequência da classe que contém a mediana; h = amplitude da classe que contém a mediana. contém a mediana; Mediana Medidas de Posição (ou de Tendência Central) 11 Exemplo: Tempo (em segundos) gasto por um funcionário Cálculo da mediana Classes xi fi Pmifi 40 45 42 3 126 45 50 47 8 376 50 55 52 16 832 55 60 57 12 684 60 65 62 7 434 65 70 67 3 201 70 75 72 1 72 50 2.725 md md a i h f F n Ldm 2 ˆ segundosdm dm 375,54ˆ 5. 16 11)2/50( 50ˆ Medidas de Posição (ou de Tendência Central) Om 12 Moda => A moda (ou modas) de um conjunto de valores é definida como o valor (ou valores) de máxima frequência. É uma quantidade que, como a média, também caracteriza o centro de uma distribuição, indicando a região das máximas frequências. => Omˆ (a) Amostra: (b) População: 3 Medidas de Posição (ou de Tendência Central) h ffff ff Lm smoamo amo io . )()( )( ˆ 13 Moda Tabelas de Frequência => Li = limite inferior da classe modal; f = frequência absoluta: anterior, seguinte e da classe modal h = amplitude das classes. Medidas de Posição (ou de Tendência Central) 14 Exemplo: Tempo (em segundos) gasto por um funcionário Cálculo da moda Classes xi fi Pmifi 40 45 42 3 126 45 50 47 8 376 50 55 52 16 832 55 60 57 12 684 60 65 62 7 434 65 70 67 3 201 70 75 72 1 72 50 2.725 h ffff ff Lm smoamo amo io . )()( )( ˆ segm m o o 33,53ˆ 5. )1216()816( )816( 50ˆ Medidas de Dispersão (ou de Variabilidade) A informação fornecida pelas Medidas de Posição em geral necessitam de ser complementadas pelas Medidas de Dispersão. As Medidas de Dispersão servem para indicar o “quanto os dados se apresentam dispersos em torno da região central”. Portanto caracterizam o grau de variação existente em um conjunto de valores. As Medidas de Dispersão que mais nos interessam são: (a) Amplitude; (b) Variância; (c) Desvio Padrão; (d) Coeficiente de Variação. Medidas de Dispersão (ou de Variabilidade) MINMAX XXH ˆ MINMAX XXH Vantagem e Desvantagem. Amplitude A amplitude, já mencionada, é definida como a diferença entre o maior e o menor valores do conjunto de dados. (a) Amostra: (b) População: Salvo aplicações de Controle de Qualidade, a amplitude não é muito utilizada como Medida de Dispersão. => => => Medidas de Dispersão (ou de Variabilidade) 222222 ˆ)(ˆˆ)( XXXSSS X 222 )( XX Variância A variância é definida como a “média dos quadrados das diferenças entre os valores em relação a sua própria média”. (a) Amostra: (b) População: Conjunto de Dados => Tabela de Frequência => Em se tratando de População: => => N μX σXσσ i N i X 2 1222 )( )( N fμX σXσσ ii k i X 2 1222 )( )( Medidas de Dispersão (ou de Variabilidade) Variância Conjunto de Dados => Tabela de Frequência => Em se tratando de Amostra: A razão de utilizarmos n - 1 no denominador da variância de dados provenientes de Amostras deve-se a motivos que veremos no tópico relacionado a Estimação. OBS: => 1 )( )( 2 122 n XX SXS i n i X 1 )( )( 2 122 n fXX SXS ii k i X 4 Medidas de Dispersão (ou de Variabilidade) 14ˆX 1 n X i n i 1 )( )( 2 122 n XX SXS i n i X Variância Ex.: Executar o cálculo da variância de um conjunto pequeno de dados, formado pelos valores seguinte: {15, 12, 10, 17, 16} As expressões apresentadas não são as mais apropriadas para o cálculo da variância, pois a média é quase sempre um valor fracionário, o que viria a dificultar o cálculo dos desvios . 2)( XX i Medidas de Dispersão (ou de Variabilidade) 22 2 XnXXX ii )2()( 222 XXXXXX iii 2 2 2 n X nX n X X ii i i n X n X X iii 22 2 )()(2 Variância Note que o numerador pode sertrabalhado: 1 )( )( 2 122 n XX SXS i n i X n X XXX iii 2 22 )()( Medidas de Dispersão (ou de Variabilidade) Variância Assim, para um conjunto com “n” dados: 11 )( )( 2 12 1 2 122 n n X X n XX SXS i n i i n ii n i X Da mesma forma, para dados agrupados em Tabela de frequência, teremos: 11 )( )( 2 12 1 2 122 n n fX fX n fXX SXS ii k i ii k iii k i X 22 Exemplo: Tempo (em segundos) gasto por um funcionário Cálculo da variância Classes xi fi Pmifi Pmi 2fi 40 45 42 3 126 5.292 45 50 47 8 376 17.672 50 55 52 16 832 43.264 55 60 57 12 684 38.988 60 65 62 7 434 26.908 65 70 67 3 201 13.467 70 75 72 1 72 5.184 50 2.725 150.775 2 2 2 2 12 12 17,46 49 50 725.2 775.150 1 segS n n fPm fPm S X ii k i ii k i X Medidas de Dispersão (ou de Variabilidade) Propriedades da Variância (a) Multiplicando-se todos os valores de uma variável por uma constante, a variância do conjunto fica multiplicada pelo quadrado dessa constante. (b) Somando-se ou subtraindo-se uma constante a todos os valores de uma variável, a variância não se altera. (i) A variância é uma medida de dispersão importante na teoria estatística; OBS: (ii) Do ponto de vista prático, ela tem o inconveniente de se expressar em unidade quadrática em relação a variável em questão. Medidas de Dispersão (ou de Variabilidade) Medidas de Dispersão (ou de Variabilidade) 2 XX SS Desvio Padrão Definimos desvio padrão como “a raiz quadrada positiva da variância”. O cálculo do desvio padrão é feito por meio da variância. XXSS X ˆ)(ˆˆ XX )( (a) Amostra: (b) População: Em se tratando de Amostra: => => => 5 17,46 49 50 725.2 775.150 1 )( 2 2 12 122 n n fX fX SXS ii k i ii k i X Desvio Padrão (i) O desvio padrão se expressa na mesma unidade da variável, sendo por isso, de maior interesse que a variância nas aplicações práticas; (ii) É mais realístico para efeito de comparação de dispersões. OBS: Exemplo: Tempo (em segundos) gasto por um funcionário segundosSXS X 79,617,46)( Medidas de Dispersão (ou de Variabilidade) Coeficiente de Variação O coeficiente de variação é definido como “o quociente entre o desvio padrão e a média”, sendo frequentemente expresso em porcentagem. XCVXCV )( (a) Amostra: (b) População: XCVXCV )( ^ ^ Em se tratando de Amostra: => => Medidas de Dispersão (ou de Variabilidade) X S VC XX ˆ 27 Exemplo: Tempo (em segundos) gasto por um funcionário Cálculo de dispersão Classes xi fi Pmifi Pmi 2fi 40 45 42 3 126 5.292 45 50 47 8 376 17.672 50 55 52 16 832 43.264 55 60 57 12 684 38.988 60 65 62 7 434 26.908 65 70 67 3 201 13.467 70 75 72 1 72 5.184 50 2.725 150.775 Medidas de Dispersão (ou de Variabilidade) %5,12125,0 5,54 795,6ˆ X S VC XX Coeficiente de Variação (i) A vantagem é caracterizar a dispersão dos dados em termos relativos ao seu valor médio; OBS: (ii) Pequena dispersão absoluta pode ser, na verdade considerável, quando comparada com a ordem de grandeza dos valores da variável. Quando consideramos o CV, enganos de interpretações desse tipo não ocorrem; (iii) Além disso, por ser adimensional, o CV fornece uma maneira de se compararem as dispersões de variáveis cujas medidas são irredutíveis. Medidas de Dispersão (ou de Variabilidade) Os dados abaixo são referentes aos teores de conservantes (em mg/100 ml do produto) e vida útil de prateleira (em dias) para uma amostra de 09 marcas de iogurtes, encontrados nos principais Hipermercados da grande São Paulo Marca Teor de Conservante (X) Vida Útil de Prateleira (Y) 1 174 73 2 161 66 3 170 64 4 180 94 5 182 79 6 164 72 7 156 62 8 168 64 9 178 90 Com base nestes valores amostrais, pede-se: A descrição dos teores de Conservantes e da Vida Útil de Prateleira dos iogurtes avaliados, de acordo com as Medidas de Tendência Central ou de Posição (média, mediana e moda), bem como, em termos de Medidas de Dispersão ou de Variabilidade (amplitude, variância, desvio padrão e coeficiente de variação). Exercício Exercício Os dados abaixo são provenientes do estudo que tem como objetivo verificar o potencial de utilização do ácido ascórbico em pepinos ‘caipira’ minimamente processados quanto ao teor de umidade. Dados obtidos: - % de umidade 58,5 60,0 62,1 63,4 64,0 65,7 66,4 67,3 67,4 68,5 68,7 69,7 70,0 71,4 72,0 73,5 74,0 74,6 75,3 75,6 78,4 81,0 81,9 82,2 82,5 82,8 86,0 87,0 87,1 88,1 Com base nos dados, pede-se: - a distribuição de frequência da variável em estudo; - medidas de tendência central ou de posição; - medidas de dispersão;
Compartilhar