Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Básica Medidas de Tendência Central Prof. Bruno Jaccoud br.jaccoud@gmail.com � Universidade Federal Rural do Rio de Janeiro Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 1 / 41 mailto:br.jaccoud@gmail.com https://github.com/jaccoudb http://lattes.cnpq.br/8959870527607708 https://www.researchgate.net/profile/Bruno-Jaccoud Resumo dos Dados Medidas de Resumo I O resumo de dados por meio de tabelas, gráficos e distribuição de frequência fornece muito mais informações sobre o comportamento de uma variável do que a tabela original de dados; I Já vimos como resumir conjuntos de dados provenientes de variáveis qualitativas e quantitativas utilizando tabelas e gráficos; I É possível resumir ainda mais estas informações, apresentando um ou alguns poucos valores que sejam representativos da série toda; I Para variáveis aleatórias quantitativas pode-se utilizar, além das tabelas e gráficos, medidas que resumem o conjunto de dados. Características importantes de qualquer conjunto de dados I Centro; I Variação; I Distribuição; I Valores atípicos Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 2 / 41 Resumo dos Dados Medidas de Resumo I Quando utilizamos um só valor, obtemos uma redução drástica das informações sugeridas pelo conjunto de dados; I Suponha que os dados observados na amostra sejam representados por: x1, x2, . . . , xn onde, n representa o tamanho da amostra. I Com os elementos desta amostra podemos encontrar números que resumem as principais características da amostra. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 3 / 41 Medidas de Resumo Medidas de Tendência Central I Média; I Mediana; I Moda. Medidas de Dispersão I Amplitude; I Quantis; I Variância; I Desvio Padrão; I Coeficiente de variação. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 4 / 41 Medidas de Tendência Central O que são? I Medidas em torno das quais as observações se distribuem; I É um valor no centro, ou meio, do conjunto de dados I As medidas de tendência central (ou medidas de posição, ou ainda ou medidas de centro) mais estudadas são: I Média; I Mediana; I Moda. I Recebem esse nome as medidas que caracterizam a localização do centro da amostra (Tendência Central), pois representam os fenômenos pelo seus valores médios, em torno dos quais tendem a concentrar-se os dados. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 5 / 41 Medidas de Tendência Central Média Aritmética Dados não Agrupados Representa a soma das observações individuais dividida pelo número de observações da amostra. Definição: Sejam x1, x2, . . . , xn, sendo “n” o tamanho da amostra X . A média aritmética simples de X pode ser representada por: x̄ = x1 + x2 + . . . + xn n = ∑n i=1 xi n = 1 n n∑ i=1 xi Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 6 / 41 Medidas de Tendência Central Média Aritmética Exemplo: Suponha que parafusos a serem utilizados em tomadas elétricas são embalados em caixas rotuladas como contendo 100 unidades. Em uma construção, 10 caixas de um lote tiveram o número de parafusos contados, fornecendo os valores 98, 102, 100, 100, 99, 97, 96, 95, 99, 100. Para essas caixas, o número médio de parafusos será dado por? Solução: Observe que n = 10 e que aplicando a formulação descrita anteriormente, teremos: x̄ = 98 + 102 + 100 + 100 + 99 + 97 + 96 + 95 + 99 + 100 10 = 986 10 = 98, 6 parafusos Importante! Observe que os dados apresentados no exemplo possuem valores próximos, e assim, a média aritmética pode ser utilizada como representativa da série toda. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 7 / 41 Medidas de Tendência Central Média Aritmética Dados Agrupados Quando os dados estiverem agrupados numa distribuição de frequên- cia usaremos a média aritmética dos valores x1, x2, . . . , xn ponderados pelas respectivas frequências absolutas f1, f2, . . . , fn Assim temos: x̄ = x1f1 + x2f2 + . . . + xnfn n = ∑n i=1 xi fi n = 1 n n∑ i=1 xi fi Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 8 / 41 Medidas de Tendência Central Média Aritmética Exemplo: Voltemos ao exemplo anterior e determine a média aritmética simples considerando os seguintes valores amostrais. 98,102,100,100,99,97,96,95,99,100 Solução: xi fi xi fi 95 1 95 96 1 96 97 1 97 98 1 98 99 2 198 100 3 300 102 1 102 x̄ = 98 + 102 + 100 + 100 + 99 + 97 + 96 + 95 + 99 + 100 10 = 986 10 = 98, 6 98 + 102 + (3 × 100) + (2 × 99) + 97 + 96 + 95 10 = 986 10 = 98, 6 Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 9 / 41 Medidas de Tendência Central Média Aritmética Média para Intervalos de Classe No caso de variáveis contínuas resumidas em tabelas de frequência com intervalos de classe, a média pode ser aproximada, calculando-se o ponto médio de cada classe PM(xi ) = lim inf + lim sup 2 e supor que os valores dentro de cada classe sejam iguais ao ponto médio. Nesse caso, ficamos com a mesma situação para o caso discreto, onde a média é calculada com pares (xi , fi ) ou (xi , fri ). Importante! Devemos lembrar que isso é uma aproximação, pois estamos perdendo informação ao assumir que todos os valores de uma classe sejam iguais. Portanto, deverá haver alguma diferença entre esta média aproximada e a média que seria calculada com os valores originais. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 10 / 41 Medidas de Tendência Central Média Aritmética Exemplo: Determine a média considerando os seguintes valores amostrais. Classes xi fi fri 4 ` 8 6 10 0,278 8 ` 12 10 12 0,333 12 ` 16 14 8 0,222 16 ` 20 18 5 0,139 20 ` 24 22 1 0,028∑ — 36 1 Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 11 / 41 Medidas de Tendência Central Média Aritmética Solução: Classes xi fi fri 4 ` 8 6 10 0,278 8 ` 12 10 12 0,333 12 ` 16 14 8 0,222 16 ` 20 18 5 0,139 20 ` 24 22 1 0,028∑ — 36 1 1 n n∑ i=1 xi fi Considerando os pontos médios de cada classe, a média é calculada por: x = 1 36 × (6× 10 + 10× 12 + 14× 8 + 18× 5 + 22× 1) = 404 36 = 11, 22 Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 12 / 41 Medidas de Tendência Central Média Aritmética I Vantagens I Medida não viesada1; I A média tende a ser mais consistente do que outras medidas de centro. I Desvantagens I Sensível à valores extremos; I Medida não resistente. 1Viesado significa algo com viés, com alguma tendência para seguir determinado caminho ou agir de certa maneira Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 13 / 41 Medidas de Tendência Central Mediana A média aritmética é, talvez, a medida mais usada. Contudo, ela pode conduzir a erros de interpretação. Em muitas situações, a mediana é uma medida mais adequada. A mediana é uma medida de centro que é o valor do meio, quando os dados são arranjados de maneira ordenada. É o valor cuja posição separa o conjunto de dados em duas partes iguais. Quando as observações são ordenadas em ordem crescente, vamos denotar a menor observação por x(1), a segunda por x(2), e assim por diante, obtendo-se x(1) ≤ x(2) ≤ . . . ≤ x(n−1) ≤ x(n) Estas observações ordenadas são chamadas de estatísticas de ordem. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 14 / 41 Medidas de Tendência Central Estatística de Ordem Exemplo: Por exemplo, se cinco observações de uma variável forem x1 = 8, x2 = 4, x3 = 3, x4 = 8, x5 = 7, então, 3 ≤ 4 ≤ 7 ≤ 8 ≤ 8 E as estatísticas de ordem são: x(1) = 3, x(2) = 4, x(3) = 7, x(4) = 8, x(5) = 8. Nesse exemplo, a mediana (Md) = 7, pois é o valor que separa o conjunto de dados em duas partes iguais. Mas note que o número de observações é ímpar . Caso fosse par , a mediana seria a média aritmética das duas observações centrais. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 15 / 41 Medidas de Tendência Central Mediana Definição: A mediana da variável X pode ser definida como: Md(X ) = X( n+12 ) , se n ímpar X( n2 ) + X( n2 +1) 2 , se n par Exemplo: Noexemplo anterior, se tivéssemos 3 ≤ 4 ≤ 7 ≤ 8 ≤ 8 ≤ 9 Então Md(X) = x(3) + x(4) 2 = 7 + 8 2 = 7, 5. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 16 / 41 Medidas de Tendência Central Mediana Qual a mediana? a) Número ímpar de elementos 2 4 6 7 11 Md(x) = 7 b) Número par de elementos 2 4 7 9 11 13 Md(x) = 7 + 9 2 = 8 Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 17 / 41 Medidas de Tendência Central Mediana Exemplo: Considere o mesmo conjunto de dados do primeiro exemplo: 98,102,100,100,99,97,96,95,99,100 Solução: Colocando em ordem crescente em forma de tabela, teremos: Ordem x(1) x(2) x(3) x(4) x(5) x(6) x(7) x(8) x(9) x(10) No de Parafusos 95 96 97 98 99 99 100 100 100 102 Como observado, o número de amostras é par, então: n = 10→ Md(X) = X( 102 ) + X( 102 +1) 2 = X(5) + X(6) 2 = 99 + 99 2 = 99 parafusos Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 18 / 41 Medidas de Tendência Central Mediana Mediana para Intervalos de Classe Para o caso de variáveis contínuas (agrupados em classes), deve-se seguir os seguintes procedimentos: 1o: Calcula-se a ordem n 2 . Como a variável é contínua, não se preocupe se n é par ou ímpar. 2o: Pela Fi identifica-se a classe que contém a mediana (classe md). 3o: Utiliza-se a fórmula: Md(X) = lMd + (n 2 − ∑ fant. ) h fMd I lMd : limite inferior da classe mediana; I n: tamanho da amostra ou número de elementos; I ∑ fant.: soma das frequências anteriores à classe mediana; I h: amplitude da classe mediana; I fMd : frequência da classe mediana. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 19 / 41 Medidas de Tendência Central Mediana Exemplo: Determine a mediana considerando os seguintes valores amostrais. Classes fi Fi 35 ` 45 5 5 45 ` 55 12 17 55 ` 65 18 35 65 ` 75 14 49 75 ` 85 6 55 85 ` 95 3 58∑ 58 — Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 20 / 41 Medidas de Tendência Central Mediana Solução: Classes fi Fi 35 ` 45 5 5 45 ` 55 12 17 55 ` 65 18 35 65 ` 75 14 49 75 ` 85 6 55 85 ` 95 3 58∑ 58 — Md(X) = lMd + ( n 2 − ∑ fant. ) h fMd Primeiramente devemos verificar o valor de n 2 = 58 2 = 29. Agora, devemos procurar na coluna das frequências acumuladas (Fi ), qual das classes em que o 29o elemento está incluído. Vemos neste caso que é na 3a classe. Aplicando então os valores na formulação para a Mediana, teremos: ∑ fant. = 17 fMd = 18 lMd = 55 Md(X) = 55 + 29 − 17 18 × 10 = 55 + 128 18 = 55 + 6, 667 = 61, 667. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 21 / 41 Medidas de Tendência Central Mediana I Vantagens I Medida resistente; I Não é influenciada pela presença de valores extremos. I Desvantagens I É uma medida viesada. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 22 / 41 Medidas de Tendência Central Média Vs Mediana Exemplo: Considere os seguintes dados amostrais: X1 = {1, 2, 3, 4, 5} Calculando a média e mediana teremos, respetivamente: I Média Amostral: (1 + 2 + 3 + 4 + 5) 5 = 3. I Mediana Amostral: {1, 2, 3 , 4, 5} = 3 Agora, se os dados são: X2 = {1, 2, 3, 4, 45} Calculando a média e mediana teremos, respetivamente: I Média Amostral: (1 + 2 + 3 + 4 + 45) 5 = 11. I Mediana Amostral: {1, 2, 3 , 4, 45} = 3 Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 23 / 41 Medidas de Tendência Central Média Vs Mediana Observação1: Logo, a média amostral foi profundamente influenciada por um único valor, e o mesmo não aconteceu com a mediana amostral. Observação2: A mediana amostral é menos influenciada que a média por observa- ções aberrantes (“outliers”). Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 24 / 41 Medidas de Tendência Central Moda I A moda de um conjunto de dados é a observação que aparece com maior frequência no conjunto; I Um conjunto pode ser unimodal , bimodal ou multimodal ; I Caso todos os valores tenham a mesma frequência, não é possível determinar a moda do conjunto de valores, conjunto amodal . Definição: É definida como a realização mais frequente do conjunto de valores observados X . Para distribuições simples (sem agrupamento em classes), a identi- ficação da Moda é facilitada pela simples observação do elemento que apresenta maior frequência, basta ordená-los para uma melhor visualização. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 25 / 41 Medidas de Tendência Central Moda Qual a moda? a) 2 5 7 9 13 15 22 amodal b) 16 19 19 21 21 21 23 27 Mo(x) = 21 → unimodal c) 2 7 7 13 15 15 22 Mo(x) = {7,15} → bimodal Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 26 / 41 Medidas de Tendência Central Moda Qual a moda? ótimo bom bom péssimo bom bom ótimo ótimo bom ótimo bom ótimo bom bom ótimo bom péssimo bom péssimo bom péssimo bom bom bom bom ótimo bom péssimo ótimo ótimo bom péssimo — — — Solução: Mo(x) = bom → unimodal Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 27 / 41 Medidas de Tendência Central Moda Exemplo: Considere o mesmo conjunto de dados do exemplo da caixa de parafusos: 98,102,100,100,99,97,96,95,99,100 Solução: Colocando em ordem crescente em forma de tabela, teremos: Ordem x(1) x(2) x(3) x(4) x(5) x(6) x(7) x(8) x(9) x(10) No de Parafusos 95 96 97 98 99 99 100 100 100 102 Como observado, o valor 100, é o mais frequente, aparecendo 3 vezes, logo: Mo(X) = 100 parafusos Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 28 / 41 Medidas de Tendência Central Moda Moda para Intervalos de Classe Para o caso de variáveis contínuas (agrupados em classes), deve-se seguir os seguintes procedimentos: 1o: Identifica-se a classe modal, ou seja, aquela que possuir maior frequência. 2o: Utiliza-se a fórmula: Mo(X) = lMo + ∆1 ∆1 + ∆2 h I lMo : limite inferior da classe modal; I ∆1: diferença entre a frequência da classe modal e a imediatamente anterior (fi − fi−1); I ∆2: diferença entre a frequência da classe modal e a imediatamente posterior (fi − fi+1); I h: amplitude da classe modal. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 29 / 41 Medidas de Tendência Central Moda Exemplo: Determine a moda considerando os seguintes valores amostrais. Classes fi Fi 0 ` 1 3 3 1 ` 2 10 13 2 ` 3 17 30 3 ` 4 8 38 4 ` 5 5 43∑ 43 — Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 30 / 41 Medidas de Tendência Central Moda Solução: Classes fi Fi 0 ` 1 3 3 1 ` 2 10 13 2 ` 3 17 30 3 ` 4 8 38 4 ` 5 5 43∑ 43 — Mo(X) = lMo + ∆1 ∆1 + ∆2 h Observando as frequências simples (fi ), vemos que na 3a classe, a frequência é igual a 17, sendo esta então definida como sendo a classe modal . Aplicando então os valores na formulação para a Moda, teremos: ∆1 = 17− 10 = 7 ∆2 = 17− 8 = 9 lMo = 2 Mo(X) = 2 + ( 7 7 + 9 ) × 1 = 2 + 0, 4375 = 2, 4375. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 31 / 41 Medidas de Tendência Central Moda I Vantagens I Resistente à valores extremos; I É a única medida de centro que pode ser usada para dados qualitativos. I Desvantagens I É uma medida viesada. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 32 / 41 Medidas de Tendência Central Análise de Dados I Podem ser utilizadas conjuntamente para auxiliar a análise dos dados; I Ou, em determinadas situações uma delas pode ser mais conveniente do que a outra: I No caso de haver um ou mais dados que se afastam do geral das observações (valores discrepantes ou outliers) a média passa a ser uma medida de tendência central inadequada, sendo a mediana uma medida mais indicada; I No caso de conjuntos multimodais ou amodais, a média ou a mediana são mais indicadas para representar a tendência central. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 33 / 41 Medidas de Tendência Central Análise de Dados I A média é utilizada: I desejamos obter a medida de posição que possui a maior estabilidade; I houver necessidade de tratamento algébrico posterior. I A mediana é utilizada: I desejamos obter o ponto que divide a distribuiçãoem partes iguais; I há valores extremos que afetam de uma maneira acentuada a média; I a variável em estudo é salário. I A moda é utilizada: I quando desejamos obter uma medida rápida e aproximada de posição; I quando a medida de posição deve ser o valor mais típico da distribuição. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 34 / 41 Medidas de Tendência Central Análise de Dados Exemplo: Novamente vamos voltar ao exemplo da caixa de parafusos. Porém considerando que uma das caixas com 1 parafusos na realidade tivesse 45 parafusos, sendo o conjunto de dados apresentado como abaixo: 98, 102, 100, 45, 99, 97, 96, 95, 99, 100 Os valores centrais para esse conjunto de dados serão: Ordem x(1) x(2) x(3) x(4) x(5) x(6) x(7) x(8) x(9) x(10) No de Parafusos 45 95 96 97 98 99 99 100 100 102 Solução: I x̄ = 98 + 102 + (2× 100) + (2× 99) + 97 + 96 + 95 + 45 10 = 931 10 = 93, 1 I md(X) = x(5) + x(6) 2 = 98 + 99 2 = 98, 5 I mo(X) = 99 & 100 (Bimodal) Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 35 / 41 Medidas de Tendência Central Análise de Dados I Ao inserir um valor atípico no conjunto de dados utilizado, pode perceber que: I A média foi bastante influenciada, passou de 98,6 para 93,1 parafusos, se tornando inadequada; I O conjunto passou a ser bimodal , o que também torna a utilização da moda inapropriada; I A mediana foi a medida que menos sofreu influência do valor atípico, sendo a mais adequada nesse caso. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 36 / 41 Posição Relativa das medidas centrais Simetria de Dados I Um conjunto de dados é dito simétrico se os dados se distribuem igualmente ao redor da média; I Pode-se dizer que um conjunto de dados é simétrico quando a média, mediana e moda são dadas pelo mesmo valor; I O conhecimento da simetria de um conjunto auxilia a interpretação do mesmo. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 37 / 41 Posição Relativa das medidas centrais Simetria de Dados Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 38 / 41 Posição Relativa das medidas centrais Simetria de Dados Mediana Média Moda Média, Mediana, Moda Mediana Média Moda Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 39 / 41 Bibliografia BUSSAB, W. O., MORETTIN, P. A. Estatística básica. São Paulo, 9ª ed., 2017. MORETTIN, L.G., Estatística Básica: Probabilidade e Inferência. São Paulo: Pearson, 2009. CLARK, J.; DOWNING, D. Estatística aplicada. São Paulo: Saraiva, 2002. STEVENSON, W. J. Estatística Aplicada à Administração. São Paulo: Harbra, 2001. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 40 / 41 Esta nota de aula pode ser compartilhada nos termos da licença Creative Commons BY-NC-ND 3.0, com propósitos exclusivamente educacionais. Prof. Bruno Jaccoud (UFRRJ) Medidas de Tendência Central 41 / 41 https://creativecommons.org/licenses/by-nc-nd/3.0/deed.en
Compartilhar