Baixe o app para aproveitar ainda mais
Prévia do material em texto
NOTAS DE AULA – ESTATÍSTICA PROF. VÍTOR MENEZES Prof. Vítor Menezes Santana 1 MEDIDAS DE POSIÇÃO Fornecem um indicativo acerca do posicionamento dos dados. Podem ser de dois tipos: • Medidas de tendência central: indicam o centro da distribuição de dados (média, mediana, moda) • Medidas separatrizes: separam o conjunto de dados de maneiras bem específicas (mediana, quartis, decis, percentis) MÉDIA (��) A média aritmética dos dados é dada pela soma dos valores observados, dividida pelo total de observações. Exemplo de cálculo de média para dados em ROL: 1, 2, 2, 2, 3, 4, 4, 5, 6, 7 �� = ∑�� � = 1 + 2 + 2 + 2 + 3 + 4 + 4 + 5 + 6 + 7 10 = 3,6 Exemplo de cálculo de média para dados agrupados por valor: Salários Frequência absoluta simples = Salário x frequência 1 1 1 2 3 6 3 1 3 4 2 8 5 1 5 6 1 6 7 1 7 TOTAL 10 36 �� = 36 10 = 3,6 Exemplo de cálculo de média para dados em classe: NOTAS DE AULA – ESTATÍSTICA PROF. VÍTOR MENEZES Prof. Vítor Menezes Santana 2 Classes de valores Ponto médio Frequência absoluta simples Ponto médio x frequência [1;4) 2,5 5 12,5 [4;7) 5,5 4 22 [7;10) 8,5 1 8,5 Total 10 43 �� = 43 10 = 4,3 Vejam que, quando temos dados em classe, perdemos informação. Assim, precisamos fazer algumas considerações. Consideramos que as frequências se referem aos pontos médios das classes. Por isso a média deu 4,3, diferente do valor 3,6 encontrado anteriormente. Procedimento opcional: utilizar a variável auxiliar “d”. Como fazer? Subtrair cada valor de X do ponto de maior frequência (2,5) e dividir pela amplitude de classe (3). Assim: X � = � − 2,5 3 2,5 0 5,5 1 8,5 2 Em seguida, calculamos a média para “d”: � Frequência absoluta simples � × � 0 5 0 1 4 4 2 1 2 10 6 �̅ = 6 10 = 0,6 Agora usamos as propriedades da média para calcular a média de X: � = � − 2,5 3 � = 3� + 2,5 �� = 3�̅ + 2,5 = 3 × 0,6 + 2,5 = 4,3 NOTAS DE AULA – ESTATÍSTICA PROF. VÍTOR MENEZES Prof. Vítor Menezes Santana 3 Vantagem do procedimento: facilita as contas, caso os valores de X sejam difíceis de se trabalhar. MÉDIA PONDERADA Multiplicamos cada valor pelo seu peso. Em seguida somamos. Depois dividimos pela soma dos pesos. Exemplo: nota da P1 igual a 9,5 e peso 1. Nota da P2 igual a 7,5 e peso 3. A média ponderada fica: 1 × 9,5 + 3 × 7,5 1 + 3 = 8 A média ponderada é igual a 8. PROPRIEDADES DAS MEDIDAS DE POSIÇÃO Somando uma constante k a cada elemento do conjunto de dados, a média também é somada de “k”. Subtraindo uma constante k de cada elemento do conjunto de dados, a média também é subtraída de “k”. Multiplicando cada elemento do conjunto de dados por uma constante “k”, a média fica multiplicada pela mesma constante. Dividindo cada elemento do conjunto de dados por uma constante “k”, a média fica dividida pela mesma constante. Tudo isso vale também para mediana e moda. MÉDIA GEOMÉTRICA E MÉDIA HARMÔNICA Por definição, a média geométrica de n valores não negativos (X1, X2, ..., Xn) é: n n i i n n XXXXG ∏ = =×××= 1 21 ... Ou seja, calculamos o produto de todos os valores. Depois tiramos a raiz “enésima”. Por definição, a média harmônica de n valores diferentes de zero (X1, X2, ..., Xn) é: 1 1 11 − = − = ∑ n i iX n H Ou seja: NOTAS DE AULA – ESTATÍSTICA PROF. VÍTOR MENEZES Prof. Vítor Menezes Santana 4 • Calculamos os inversos dos valores; • Em seguida, determinamos a média aritmética desses inversos; • Posteriormente, invertemos o resultado, obtendo a média harmônica Vamos ver alguns exemplos que fica mais fácil. Suponhamos que nossos dados são apenas: 3 e 12. Apenas dois números (para facilitar as contas). Para calcular a média aritmética, conforme vimos na seção anterior, ficamos com: 5,7 2 123 = + =X A média geométrica é diferente. Para obtê-la, multiplicamos todos os dados. Depois tiramos a raiz “enésima”. Como neste caso são apenas dois valores, será a raiz quadrada. 61232 =×=G A média harmônica é um pouco mais complicada. Vamos dividir em três passos. Primeiro passo: achamos os recíprocos de cada valor. Para obter o recíproco de um número, basta inverter seu numerador com seu denominador. Vamos a um exemplo. Tomemos o número 3 2 . Seu recíproco é 2 3 . No nosso caso, os valores são 3 e 12. O recíproco de 3 é 3 1 . O recíproco de 12 é 12 1 . Segundo passo: calculamos a média aritmética dos recíprocos. Ficamos com: 24 5 2 12 14 2 12 1 3 1 = + = + Terceiro passo: calculamos o recíproco do valor obtido acima. Pronto. Esta é a média harmônica. 5 24 =H 8,4=H NOTAS DE AULA – ESTATÍSTICA PROF. VÍTOR MENEZES Prof. Vítor Menezes Santana 5 Se resumirmos todos esses três passos numa frase, podemos dizer que a média harmônica é o recíproco da média aritmética dos recíprocos dos valores. Uma coisa que cai bastante em concurso não é essa parte de contas. É simplesmente saber o seguinte: Para qualquer conjunto de n números positivos, a média harmônica é menor ou igual à média geométrica e esta é menor ou igual à média aritmética. A igualdade só ocorre se todos os números forem iguais entre si. Vamos olhar no caso dos números 3 e 12. A média aritmética foi de 7,5. Foi a maior das médias. A média harmônica foi de 4,8. Foi a menor das três. E a média geométrica foi de 6, o valor intermediário. Se, em vez de 3 e 12, os valores fossem 12 e 12, aí teríamos: 12=== HGX Quando todos os valores são iguais, as médias coincidem. Resumindo, o que geralmente cai em prova é saber que: XGH ≤≤ (e a igualdade só ocorre se todos os dados forem iguais) MEDIDAS SEPARATRIZES Medidas separatrizes são medidas que separam os dados de forma bem específica. A medida separatriz mais importante é a mediana. Além de ser uma medida separatriz, ela é uma medida de tendência central. Ela, assim como a média e a moda, nos indica um valor em torno do qual os dados “giram”. Além de ser uma medida de tendência central, ela também é uma medida separatriz. Isto porque ela separa os dados de uma forma bem específica. Sendo a mediana o termo do meio, ela deixa metade dos dados à sua esquerda e a outra metade à sua direita. Outra medida separatriz é o quartil. São três quartis, dividindo a seqüência de dados em quatro partes iguais (em quatro partes com o mesmo número de termos). O primeiro quartil separa a sequência de dados de forma que à sua esquerda fiquem 25% dos valores e à sua direita 75%. Assim, o primeiro quartil é o valor que não é superado por 25% das observações. O segundo quartil coincide com a mediana, deixando 50% dos valores de cada lado. O terceiro quartil deixa à sua esquerda 75% dos valores e à sua direita 25%. Logo, o terceiro quartil é o valor que não é superado por 75% das observações. Outra medida separatriz é o decil. São nove decis que dividem a série em dez partes iguais. O primeiro decil deixa à sua esquerda 10% dos valores; à sua direita 90% (ou seja, não é superado por 10% das observações). O segundo decil deixa à sua esquerda 20% dos valores; à sua direita 80%. E assim por diante. NOTAS DE AULA – ESTATÍSTICA PROF. VÍTOR MENEZES Prof. Vítor Menezes Santana 6 O quinto decil coincide com a mediana, deixando 50% dos valores de cada lado. A última medida separatriz que veremos é o percentil. O primeiro percentil deixa àsua esquerda 1% dos valores e à sua direita 99% (ou seja, não é superado por 1% das observações). O segundo percentil deixa à sua esquerda 2% dos valores e à sua direita 98%. E assim por diante. O quinquagésimo percentil coincide com a mediana, deixando 50% dos valores de cada lado. Mediana para dados em ROL. O termo que ocupa a posição central é a mediana. Se o conjunto tiver um número par de elementos, a mediana é a média dos dois termos centrais. Exemplo: 1, 2, 2, 2, 3, 4, 4, 5, 6, 7 Dados centrais destacados em vermelho. � = 3 + 4 2 = 3,5 Quartis para dados em ROL A mediana coincide com o segundo quartil. Ela divide o conjunto em duas partes iguais. A mediana da primeira parte é o primeiro quartil. A mediana da segunda parte é o terceiro quartil. Obs: amplitude interquartílica: �� − �� Medidas separatrizes para dados em classe Usar interpolação linear a partir dos valores de frequências acumuladas. Exemplo: AFRF 2003 [ESAF] Considere a tabela de frequências seguinte correspondente a uma amostra da variável X. Não existem observações coincidentes com os extremos das classes. NOTAS DE AULA – ESTATÍSTICA PROF. VÍTOR MENEZES Prof. Vítor Menezes Santana 7 Classes Frequências Acumuladas 2.000 – 4.000 5 4.000 – 6.000 16 6.000 – 8.000 42 8.000 – 10.000 77 10.000 – 12.000 89 12.000 – 14.000 100 Assinale a opção que corresponde à estimativa do valor x da distribuição amostral de X que não é superado por cerca de 80% das observações. a) 10.000 b) 12.000 c) 12.500 d) 11.000 e) 10.500 Primeiro localizamos os valores com frequências próximas de 80%: Classes Frequências Acumuladas 2.000 – 4.000 5 4.000 – 6.000 16 6.000 – 8.000 42 8.000 – 10.000 77 10.000 – 12.000 89 12.000 – 14.000 100 Na interpolação linear, nós vamos fazer o seguinte. Fazemos a segunda linha menos a primeira. Fazemos a terceira linha menos a primeira. Primeira linha 10.000 77 Segunda linha Z 80 Terceira linha 12.000 89 Subtraindo, ficamos com: 000.10−Z 7780 − 000.10000.12 − 7789 − A interpolação linear nos diz que as diferenças das linhas de baixo com a linha de cima são proporcionais. 7789 7780 000.10000.12 000.10 − − = − −Z NOTAS DE AULA – ESTATÍSTICA PROF. VÍTOR MENEZES Prof. Vítor Menezes Santana 8 Isolando o Z, temos: 12 3000.2000.10 ×+=Z 500.10=Z Concluindo: O valor 10.500 não é superado por 80 observações. MODA Corresponde ao termo de maior frequência simples. Se os dados estiverem em classe, usamos a moda de Czuber: )()( postMantM antM M ffff ffhlM −+− − += Exemplo: SEFAZ BA 2004 [FCC] Considere a tabela abaixo, que mostra a distribuição de salários (em reais) de 160 funcionários de determinada empresa, com suas respectivas frequências relativas acumuladas. Classes em reais Frequência relativa acumulada (%) Classes em reais Frequência relativa acumulada (%) [600,1000) 10 [1000,1400) 30 [1400,1800) 70 [1800,2200) 95 [2200,2600) 100 O valor modal dos salários (desprezando os centavos), é: a) 1784 b) 1666 c) 1648 d) 1636 e) 1628 Primeira consideração: a moda está na classe de maior frequência simples. É a classe modal: NOTAS DE AULA – ESTATÍSTICA PROF. VÍTOR MENEZES Prof. Vítor Menezes Santana 9 Classes Frequência simples (%) [600,1000) 10 Classe anterior [1000,1400) 20 Classe modal [1400,1800) 40 Classe posterior [1800,2200) 25 [2200,2600) 5 Segundo passo: determinar os valores de amplitude, frequência e limite inferior da classe modal. A classe modal é a de [1400,1800). Qual sua amplitude? A amplitude da classe é a diferença entre o limite superior e o limite inferior. No caso: =h 40014001800 =− Logo, sua amplitude é de 400 (h = 400). A frequência da classe modal é de 40% (fmo = 0,4). Basta olhar na tabela fornecida acima. O limite inferior da classe modal é 1400 (lM = 1400). Terceiro passo: determinar os valores das frequências das classes anterior e posterior. A classe que vem logo antes da classe modal é a classe [1000,1400). Esta é a classe anterior. A frequência da classe anterior é 20% (fant = 0,2). A classe que vem logo depois da classe modal é a classe [1800,2200). Esta é a classe posterior. A frequência da classe posterior é 25% (fpost = 0,25). Identificados todos esses elementos, basta aplicar uma fórmula. É a chamada fórmula de Czuber. Esta fórmula é fruto de uma segunda consideração. Ela considera que os valores das frequências se comportam segundo uma parábola. É claro que nós não vamos ficar desenhando gráficos de parábola. Para concurso, é muito mais prático gravar logo a fórmula de Czuber. Resumindo: quando os dados estão em classes, o cálculo da moda se resume à aplicação da seguinte fórmula (de Czuber): )()( postMantM antM M ffff ffhlM −+− − += Onde: • lM é o limite inferior da classe modal • h é a amplitude da classe modal • fM é a frequência simples da classe modal NOTAS DE AULA – ESTATÍSTICA PROF. VÍTOR MENEZES Prof. Vítor Menezes Santana 10 • fant é a frequência da classe anterior • fpost é a frequência da classe posterior Substituindo os valores: )()( postMantM antM M ffff ffhlM −+− − += 57,1628)25,04,0()2,04,0( 2,04,04001400 = −+− − ×+=M Gabarito: E. Observação: existem outras modas, quase nunca cobradas em prova. • King: postant post M ff f hlM + += • Bruta: considerar que a moda é igual ao ponto médio da classe modal • Pearson: XDM 23 −≅ (onde D é a mediana)
Compartilhar