Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA I Professora Kelly Alonso Medidas de Posição e Dispersão Email: kellyalonso@uol.com.br 2 Através da distribuição de frequência podemos observar a distribuição dos valores em diferentes formas. Dessa forma, podemos localizar também a concentração dos valores. Existem diferentes elementos estatísticos para observar as tendências características dos valores. E as medidas mais conhecidas são: - medidas de posição; - medidas de variabilidade ou dispersão; - medidas de assimetria; - medidas de curtose. *Vamos concentrar nossos estudos nas duas primeiras. Medidas de Posição 3 As medidas de posição mais importantes são as Medidas de Tendência Central. Essas medidas são assim denominadas por indicarem um ponto em torno do qual se concentram os dados. Este ponto tende a ser o centro da distribuição dos dados. Entre as medidas de tendência central, as principais são: - a média aritmética; - a mediana; - a moda. Medidas de Posição Medidas de Posição – Média Aritmética A média aritmética é a soma de todos os valores observados da variável dividida pelo número total de observações. Sob uma visão geométrica a média de uma distribuição é o centro de gravidade, representa o ponto de equilíbrio de um conjunto de dados. É a medida de tendência central mais utilizada para representar a massa de dados. Seja (x1, ..., xn) um conjunto de dados. A média é dada por: , onde n é o tamanho da amostra. , onde N é o tamanho da população. Dados não-agrupados: Medidas de Posição – Média Aritmética Caso os dados estejam apresentados segundo uma distribuição de freqüência, tem-se: , onde n é o tamanho da amostra. , onde N é o tamanho da população. Dados agrupados: Dados agrupados: Neste caso, como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada. Medidas de Posição – Média Aritmética ∑ ∑ = i ii f fx x O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna correspondente aos produtos xifi: Tabela Medidas de Posição – Média Aritmética Exemplos: 1) Sabendo-se que a produção leiteira diária da vaca B, durante uma semana foi (em litros): 12181615131410 DomSabSexQuiQuarTerSeg Qual é a produção média da semana? litrosX 14 7 12181615131410 = ++++++ = Medidas de Posição – Média Aritmética Exemplos: Qual é a média de filhos do sexo masculino? 2) Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino: Medidas de Posição – Média Aritmética Então: Logo: Conclusão? 2) Consideremos a distribuição relativa a estatura de alunos de uma disciplina: Medidas de Posição – Média Aritmética Qual é a estatura média dos alunos? 11 Como, neste caso: Temos: ,40,440.6 ∑ ∑∑∑ === i ii iii f fx xeffx cmxx 161161 40 440.6 =⇒== Conclusão? 11 Medidas de Posição – Mediana A mediana de um conjunto de dados é o número central, quando os números estão ordenados segundo suas grandezas (crescente ou decrescente). Se o tamanho da amostra é impar, a mediana, Md, é o número central, quando o tamanho da amostra é par, a mediana é a média dos dois números centrais. Exemplos: 1) Encontre a mediana dos dados abaixo: 4, 13, 11, 2, 21, 15, 6, 16, 9 Em ordem: 2, 4, 6, 9, 11, 13, 15, 16, 21 Md = 11 Medidas de Posição – Mediana 2) Encontre a mediana dos dados abaixo: 2, 18, 7, 12, 6, 10, 21, 13 Em ordem: 2, 6, 7, 10, 12, 13, 18, 21 Md = 2 1210+ Md = 11 Medidas de Posição – Mediana Se os dados se agrupam em uma distribuição de frequência, o cálculo da mediana se processa de modo muito semelhante àquele dos dados não- agrupados, implicando, porém, a determinação prévia das frequências acumuladas. Para o caso de uma distribuição, a ordem, a partir de qualquer um dos extremos, é dada por: 2 ∑ if Sem intervalos de classe: identificar a frequência acumulada imediatamente superior à metade da soma das frequências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada. Medidas de Posição – Mediana Exemplo: 8 2 fa 30 18 34 217 2 34 2 =⇒== ∑ Mdf i meninos Com intervalos de classe: Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana. Para tanto, temos que determinar a classe na qual se acha a mediana - classe mediana. Tal classe será aquela correspondente à frequência acumulada imediatamente superior a . 2 ∑ if Medidas de Posição – Mediana Exemplos - é o limite inferior da classe mediana; - é a frequência acumulada da classe anterior à classe mediana; - é a frequência simples da classe mediana; - é a amplitude do intervalo da classe mediana. 20 22 40 2 = ∑ ⇒= ∑ ii ff [ ] cmMdMd 5,1604. 11 1320158 =⇒−+= l* l* l* l* = 158 F(ant)= 13 h*= 4 f*= 11 20 2 = ∑ if 11 fa 4 13 24 32 37 40 OBS Medidas de Posição – Moda A moda (Mo) é o valor que ocorre maior número de vezes no conjunto de dados. Exemplos: 1) Encontre a moda dos dados abaixo: a) 7, 8, 9, 10, 10, 10, 11, 12, 13, 15 Mo = 10 b) 3, 5, 8, 10, 12, 13 Mo = Amodal c) 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9, 9 Mo = 4 e 7 Bimodal 2) Encontre a moda da distribuição abaixo: Medidas de Posição – Moda Mo = 3 3) Encontre a moda da distribuição abaixo: Obs.: Com intervalo de classe Medidas de Posição – Moda A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor denominação de moda bruta. Temos então: Onde llll* é o limite inferior da classe modal; L* é o limite superior da classe modal. 2 * LlMo += 3) Encontre a moda da distribuição abaixo: Medidas de Posição – Moda Temos que a classe modal é i=3, l*=158 e L*=162. cm Medidas de Posição A mediana caracteriza uma série de valores devido à sua posição central, mas também separa a série em dois grupos que apresentam o mesmo número de valores. Assim, além das medidas de posição, há outras que, consideradas individualmente, não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua segunda característica. Essas medidas _ os quartis, os percentis e os decis _ são, juntamente com a mediana, conhecidas pelo nome genérico de separatrizes. �Quartis: os valores de uma série que a dividem em quatro partes iguais. - o primeiro quartil – Q1 – 25% das observações; - o segundo quartil – Q2 - (igual à mediana); - o terceiro quartil – Q3 – 75% das observações. Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana, por: 2 ∑ if 4 ∑ ifk * * )( 4 *1 hf antFf lQ i − ∑ += , sendo k o número de ordem do quartil. Assim temos: * * )( 4 3 *3 hf antFf lQ i − ∑ += Medidas de Posição 1) Encontre o primeiro e terceiro quartis da distribuição abaixo: Exemplo fa Medidas de Posição fa �Percentis: os noventa e nove valores que separam uma série em 100 partes iguais. Medidas de Posição Indicamos O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém a fórmula passa a ser:.,...,...,,, 993221 PPPP 100 ∑ ifk K – número de ordem do percentil Obs.: com intervalo de classe Pk k 100 Exemplo: Calcule o 37o percentil para a distribuição abaixo: P37 37 K = 37 100 [ ] cmP PP 7,158 65,1584 11 138,14158 37 3737 = =⇒ − += 8,14 100 40.37 100 37 ⇒= ∑ ⇒ i f K = 37 37% P10 Q1 Md Q3 P90 P37 Exercício: Observando a distribuição abaixo, calcule: a) a média b) a mediana c) a moda d) o primeiro e o terceiro quartis e) o 23º percentil Estaturas (cm) 150 l 158 5 158 l 166 166 l 174 174 l 182 182 l 190 12 18 27 8 70 Fonte: Marcelo Menezes Reis em http://www.inf.ufsc.br/~marcelo/INE5121.html São utilizadas para medir a variabilidade dos dados de uma amostra ou população. As principais medidas são: - a amplitude, - a variância, - o desvio padrão. Medidas de Dispersão ou Variabilidade São medidas da dispersão de um conjunto de dados em torno da média, ou seja, da maior ou menor variabilidade dos resultados obtidos. Elas permitem identificar até que ponto os resultados se concentram ou não ao redor da tendência central de um conjunto de observações. Medidas de Dispersão – Amplitude É a diferença entre o maior e o menor valor observado num conjunto de dados, servindo para caracterizar a abrangência do estudo. Exemplo: Calcule a média, mediana e amplitude para as amostras abaixo: Amostra 1: 40, 60, 70, 50, 80, 90 Amostra 2: 67, 63, 64, 66, 40, 90 40, 50, 60, 70, 80, 90 Média: 65 Mediana: 65 Amplitude: 90 - 40 = 50 40, 63, 64, 66, 67, 90 Média: 65 Mediana: 65 Amplitude: 90 - 40 = 50 Amostra 3: 64, 63, 60, 70, 67, 66 60, 63, 64, 66, 67, 70 Média: 65 Mediana: 65 Amplitude: 70 - 60 = 10 Obs.: com intervalos de classe. Medidas de Dispersão – Variância É a soma dos quadrados dos desvios da média dividido por n-1, em amostras. Sendo n, o número de elementos da amostra. Sendo N, o número de elementos da população. 1 )(1 22 − ∑ − = = n XX s n i i N Xni i∑ − = =1 2 2 )( µσ Medidas de Dispersão – Desvio Padrão É definido pela raiz quadrada positiva da variância Sendo n, o número de elementos da amostra. Sendo N, o número de elementos da população. 1 )(1 2 − ∑ − = = n XX s n i i N Xni i∑ − = =1 2)( µ σ 22 ∑ − ∑ = n X n X s ii 22 ∑ ∑ − ∑ ∑ = i ii i ii f Xf f Xf s Com intervalo de classe Observação: Exemplos: 1) Calcule a variância e o desvio padrão para os dados abaixo: 8, 10, 11, 15, 16, 18 ∑ =1090∑ = 78 32418 25616 22515 12111 10010 648 X i 2X i 22 ∑ − ∑ = n X n X s ii 7,3 6 78 6 1090 2 = −= s s S2 = 12,67 8, 10, 11, 15, 16, 18 n = 6 X = 13 1 )(1 2 − ∑ − = = n XX s n i i ( ) ( ) ( ) ( ) ( ) ( ) 16 13181316131513111310138 2222222 − −+−+−+−+−+− =s S2 = 15,2 S = 3,9 Exemplos: 2) Calcule a variância e o desvio padrão para os dados abaixo: fiXi fiXi2 0 6 20 36 16 ∑=78 ∑=218 0 6 40 108 64 22 ∑ ∑ − ∑ ∑ = i ii i ii f Xf f Xf s 2 34 78 34 218 −=s S2 = 1,149 S = 1,07 Xi Exemplos: 3) Calcule a variância e o desvio padrão para os dados abaixo: S2 = 31 S = 5,57 Observações sobre desvio padrão: Através da sua definição e propriedades, para distribuições normais*, isso significa que: a) 68,26% dos casos estão incluídos entre X-s e X+s (isto é, um desvio padrão de cada lado da média) b) 95,46% dos casos estão incluídos entre X-2s e X+2s (isto é, dois desvio padrão de cada lado da média) c) 99,73% dos casos estão incluídos entre X-3s e X+3s (isto é, três desvio padrão de cada lado da média) X-s X X sX-2s X 2sX-3s X 3s Observações sobre desvio padrão: Variável reduzida, escores reduzidos: A variável , que mede o desvio em relação à s XX z − = média, em unidades de desvio padrão, é denominada variável reduzida e é uma quantidade abstrata (ou seja, independe das unidades usadas). Se os desvios em relação à média forem dados em unidades de desvio padrão, diz-se que estão expressos em unidades reduzidas ou escores reduzidos. Essas grandezas são muito importantes em comparações entre distribuições. Exemplos: 1) Um estudante recebeu grau 84 em um exame final de matemática, para o qual o grau médio foi 76 e o desvio padrão 10. No exame de geografia, para o qual o grau médio foi 82 e o desvio 16, ele recebeu o grau 90. em que matéria sua posição relativa foi mais elevada? 8,0 10 7684 =⇒ − = zz s XX z − = Para matemática: Para geografia: Conclusões? 5,0 16 8290 =⇒ − = zz
Compartilhar