Baixe o app para aproveitar ainda mais
Prévia do material em texto
Guillermo Guillermo Guillermo Guillermo PatricioPatricioPatricioPatricio Ortega Ortega Ortega Ortega JácomeJácomeJácomeJácome �Ao se trabalhar com um conjunto de observações, torna-se necessário encontrar alguns parâmetros (medidas) que representem a série. �Estas medidas permitirão que sejam feitas descrições da população objeto de pesquisa, bem como estudos comparativos com outras populações. As principais medidas estatísticas que poderão ser utilizadas na compreensão e análise dos dados são: � Média � Mediana � Moda � Separatriz (quartil, decil e percentil ou centil) Exemplo � suponha-se que uma firma responsável pela seleção dos candidatos, deseje avaliar o comportamento do desempenho dos candidatos na última seleção em relação ao realizado no ano anterior. � Os responsáveis pela elaboração das provas acreditam que o nível desta última turma é superior, tendo em vista que o grau de dificuldade das duas provas foi praticamente o mesmo. � Na última seleção, 120 candidatos realizaram a prova e obtiveram os resultados contidos na Tabela 2.1. Tabela 2.1.- Distribuição de notas dos candidatos Notas (pontos) Número de candidatos Percentagem (%) 10 10 10 10 ├ 25252525 12121212 10,010,010,010,0 25 25 25 25 ├ 40404040 21212121 17,517,517,517,5 40 40 40 40 ├ 55555555 30303030 25,025,025,025,0 55 55 55 55 ├ 70707070 26262626 21,721,721,721,7 70 70 70 70 ├ 85858585 18181818 15,015,015,015,0 85 85 85 85 ├ 100100100100 13131313 10,810,810,810,8 TotalTotalTotalTotal 120120120120 100,0100,0100,0100,0 Para responder a este questionamento, torna-se necessário utilizar algumas medidas estatísticas. A primeira medida de tendência central a ser considerada será a média aritmética. Existem dois tipos de média aritmética: Simples Ponderada “A média aritmética simples é definida como sendo o quociente entre a soma de todos os valores observados e o número de observações”. A sua obtenção é feita através da seguinte expressão matemática. Onde: Xi é o i-ésimo valor observado N é o número de observações. Exemplo 1: Seja o conjunto de valores 5, 7, 8, 9, 4 e 3. A média aritmética simples deste conjunto será: Ocorre muitas vezes na prática, que um ou vários valores aparecem mais de uma vez. ExemploExemploExemploExemplo 2222:::: Seja o conjunto de valores: 5, 7, 8, 5, 5, 6, 6, 7, 7, 7, 7, 8, 8 e 9. Neste caso, o cálculo da média terá de levar em conta a frequência com que este valores aparecem e isso se faz com amédia aritmética ponderada. A média aritmética ponderada é obtida: multiplicando-se os valores (Xi) pelo número de vezes (fi) que ocorre na série a soma deste produto é dividido pelo número total de observações (N) A média aritmética ponderada tem a seguinte expressão matemática: onde: fi é a frequência do i-ésimo valor observado (Xi) N é o número total de observações. Tabela Tabela Tabela Tabela 2.2.2.2.2.2.2.2. Valores observados Frequência 5 3 6 2 7 5 8 3 9 1 Total 14 Tabela 2.3.Tabela 2.3.Tabela 2.3.Tabela 2.3. Valores observados Frequência Produto 5 3 15 6 2 12 7 5 35 8 3 24 9 1 9 Total 14 95 Como ΣXΣXΣXΣXiiiiffffiiii = 95 e N = 14 então 95 / 14 = 6,79 logo neste exemplo, a média será aproximadamente 6,79 Para o cálculo da média aritmética ponderada nos casos de tabelas de frequências, o raciocínio é análogo. Só que nestes casos Xi passa a ser o pontopontopontoponto médiomédiomédiomédio ((((PPPPmmmm)))) do intervalo de classe, como definido no capítulo anterior, e a expressão matemática passa a ser: Exemplo: determinar as médias aritméticas das notas dos candidatos apresentadas nas tabelas Para obter a média aritmética nas duas tabelas de frequência, determinam-se inicialmente os pontos médios (Pm) dos intervalos de classe nas duas tabelas, os quais serão: Tabela 2.1.Tabela 2.1.Tabela 2.1.Tabela 2.1.---- Distribuição de notas dos candidatosDistribuição de notas dos candidatosDistribuição de notas dos candidatosDistribuição de notas dos candidatos Notas Notas Notas Notas (pontos)(pontos)(pontos)(pontos) Número deNúmero deNúmero deNúmero de candidatoscandidatoscandidatoscandidatos Percentagem Percentagem Percentagem Percentagem (%)(%)(%)(%) 10 10 10 10 ├ 25252525 12121212 10,010,010,010,0 25252525├ 40404040 21212121 17,517,517,517,5 40 40 40 40 ├ 55555555 30303030 25,025,025,025,0 55 55 55 55 ├ 70707070 26262626 21,721,721,721,7 70 70 70 70 ├ 85858585 18181818 15,015,015,015,0 85 85 85 85 ├ 100100100100 13131313 10,810,810,810,8 TotalTotalTotalTotal 120120120120 100,0100,0100,0100,0 17,517,517,517,5 32,532,532,532,5 47,547,547,547,5 62,562,562,562,5 77,577,577,577,5 92,592,592,592,5 Tabela 2.4.a.Tabela 2.4.a.Tabela 2.4.a.Tabela 2.4.a. Ponto MédioPonto MédioPonto MédioPonto Médio FrequênciaFrequênciaFrequênciaFrequência ProdutoProdutoProdutoProduto 17,517,517,517,5 12121212 210,0210,0210,0210,0 32,532,532,532,5 21212121 682,5682,5682,5682,5 47,547,547,547,5 30303030 1425,01425,01425,01425,0 62,562,562,562,5 26262626 1625,01625,01625,01625,0 77,577,577,577,5 18181818 1395,01395,01395,01395,0 92,592,592,592,5 13131313 1202,51202,51202,51202,5 TotalTotalTotalTotal 120120120120 6540,06540,06540,06540,0 Tabela 2.4.b.Tabela 2.4.b.Tabela 2.4.b.Tabela 2.4.b. Ponto médioPonto médioPonto médioPonto médio FrequênciaFrequênciaFrequênciaFrequência ProdutoProdutoProdutoProduto 17,517,517,517,5 8888 140,0140,0140,0140,0 32,532,532,532,5 10101010 325,0325,0325,0325,0 47,547,547,547,5 30303030 1425,01425,01425,01425,0 62,562,562,562,5 25252525 1562,51562,51562,51562,5 77,577,577,577,5 5555 387,5387,5387,5387,5 92,592,592,592,5 2222 185,0185,0185,0185,0 TotalTotalTotalTotal 80808080 4025,04025,04025,04025,0 = 6540,0 / 120 = 54,5 pontos = 4025,0 / 80 = 50,3 pontos Com base nestas informações, pode-se concluir que a última turma de candidatos foi melhor que a anterior? Em termos de média aritmética, simsimsimsim, porém nem sempre a média aritmética é um bom indicador. Considere-se agora as notas individuais (dados brutos), a média aritmética será: Como se pode observar, a média aritmética dos valores individuais, é diferente da obtida quando se considera a tabela de frequência. = 6216/120 = 51,8 pontos = 6216/120 = 51,8 pontos = 6216/120 = 51,8 pontos = 6216/120 = 51,8 pontos ObservaçõesObservaçõesObservaçõesObservações acercaacercaacercaacerca dadadada médiamédiamédiamédia aritméticaaritméticaaritméticaaritmética � a média aritmética é amplamente utilizada, porém em algumas situações de forma inadequada � a média aritmética é sensível a quaisquer mudanças que ocorram em um ou mais valores da série � a média aritmética é rigorosamente definida e fácil de ser calculada, porém em algumas situações, não será possível o seu cálculo, como nos casos de distribuições de frequência que possuem classes de limites não definidos � a média aritmética é mais estável que quaisquer das outras medidas que serão vistas posteriormente � a média aritmética tem a desvantagem de ser extremadamente sensível aos valores muito heterogêneos da série � as médias aritméticas de diversas amostras podem ser combinadas para se obter a média aritmética do todo � no caso de distribuição acentuadamente assimétrica, a média aritmética não será representativa da série Normalmente torna-se necessário o conhecimento de outras medidas estatísticas para a caracterização de uma distribuição,pois a média por si só, não é suficiente. Uma outra medida de posição, frequentemente utilizada para a análise estatística de dados, é a mediana “A mediana é o valor central de uma série” � a mediana de um conjunto de valores ordenados (crescente e decrescente) divide este conjunto em duas partes iguais � existirão 50% dos valores da série acima da mediana e os 50% restantes, abaixo Considere as notas dos candidatos do último concurso em ordem crescente: Os elementos centrais do rol, neste caso, serão: (N/2) → 120/2 → elemento 60 → ou seja 50 pontos portanto a mediana será de 50 pontos Se o número de observações for ímpar [(N+1) / 2] → [(121121121121+1) / 2] → elemento 61 → ou seja 50 pontos portanto a mediana será de 50 pontos Exemplo 1: Seja o conjunto de valores 6, 4, 7, 10 e 9 (anos) A mediana deste conjunto será obtida calculando-se inicialmente o elemento mediano, ou seja, [(N+1) / 2] → (5+1) / 2 = 3 portanto o elemento mediano é o terceiro do rol Para se encontrar a mediana, vai-se ao conjunto de dados e identifica-se o elemento de ordem terceiro ( já ordenado o rol: 4, 6, 7, 9, 10 ), que no caso presente é 7 anos No caso de tabelas de frequência, o elemento mediano (hipotético) será identificado dividindo-se o número de observações (N) por 2, independente deste número ser par ou ímpar. Tem-se que o elemento mediano = N/2 Elemento mediano = 120/2 = 60 Tabela 1.3.- Intervalos de Classe Frequência Simples (fi) Frequência Acumulada (Fi) 10 ├ 25 12 12 25 ├ 40 21 33 40 ├ 55 30 63 55 ├ 70 26 89 70 ├ 85 18 107 85 ├ 100 13 120 Significa que a mediana estará no intervalo da classe 40 ├ 55, visto que a frequência acumulada até essa classe é 63 Observando-se a frequência acumulada, pode-se constatar que até a classe anterior a que contém a mediana, existem 33 candidatos O objetivo e localizar o elemento 60, ou seja, tem-se de localizar na classe da mediana o elemento de ordem 27, pois 33 + 27 = 60 Neste ponto torna-se necessário uma hipótese; a da que os candidatos estão distribuídos uniformemente no intervalo de classe. Pela distribuição, constata-se que na classe mediana existem 30 candidatos, e que a amplitude da classe é 15 pontos, o que significa que pela hipótese formulada existem 2 candidatos por cada unidade de medida. O elemento de ordem 27 neste intervalo de classe estará a 13,5 pontos do limite inferior da classe, que é de 40 pontos, resultando então uma mediana de 53,5 pontos. Pode-se portanto dizer que 50% dos candidatos obtiveram nota inferior a 53,5 pontos e 50% nota superior a 53,5 pontos Este processo pode ser expresso matematicamente pela seguinte expressão: Me = mediana li = limite inferior da classe que contém a mediana Em = elemento mediano Fa = frequência acumulada até a classe anterior a classe da mediana fi = frequência da classe mediana h = amplitude do intervalo de classe que contém a mediana Me = mediana li = limite inferior da classe que contém a mediana → 40404040 Em = elemento mediano → 60606060 Fa = frequência acumulada até a classe anterior a classe da mediana → 33333333 fi = frequência da classe que contém a mediana → 30303030 h = amplitude do intervalo de classe que contém a mediana → 15151515 Observações: a facilidade no cálculo da mediana é uma das vantagens e os valores extremos quase não têm influência sobre ela no caso de amostras, a mediana tem menos estabilidade que a média aritmética, se o número de observações for pequeno a mediana pode ser calculada, mesmo que a tabela de frequência contenha classes de intervalos ilimitados a mediana tem a desvantagem de exigir que os termos sejam postos em ordem de magnitude antes de ser calculada às vezes, não há mediana numa série descontínua
Compartilhar