Baixe o app para aproveitar ainda mais
Prévia do material em texto
Versão Condensada ESTATÍSTICA Estatística descritiva: medidas tendência central 2 A L F A C O N Sumário Estatística descritiva: medidas tendência central ������������������������������������������������������� 3 1� Mediana (me) ����������������������������������������������������������������������������������������������������������������������������������������������������������� 3 1.1 Mediana para dados brutos: .............................................................................................................................................. 3 1.2 Mediana para dados ponderados: ................................................................................................................................... 4 1.3 Mediana para dados agrupados: .......................................................................................................................................6 2� Moda (mo) ��������������������������������������������������������������������������������������������������������������������������������������������������������������� 7 2.1 Moda para dados brutos: ...................................................................................................................................................8 2.2 Moda para dados ponderados: .........................................................................................................................................8 2.3 Moda para dados agrupados: ...........................................................................................................................................8 Estatística descritiva: medidas tendência central 3 A L F A C O N Estatística descritiva: medidas tendência central 1. Mediana (me) A mediana é uma medida que divide o conjunto de dados em exatamente 50% para cada lado, por isso ela é um valor de referência para indicar o dado que está exatamente no centro. É uma medida ideal para ser utilizada quando o objetivo for classificar os elementos avaliados e distingui-los quanto ao desempenho na metade. Para calcular e identificar a mediana, é necessário que o conjunto de dados esteja ordenado de forma crescente, em rol. Além disso, se a quantidade de elementos for ímpar, o valor da mediana corresponde ao valor de central do conjunto de dados. Todavia, se a quantidade de elementos for par, é preciso obter a média dos valores centrais para obter a mediana. 1.1 Mediana para dados brutos: Inicialmente, os dados devem ser colocados em ordem crescente, após isso deve ser identificada a posição central. A identificação pode ser de forma visual ou calculando a posição do centro. X = {15, 20, 10, 30, 20, 15, 0, 5, 15} n = 9 Dados em rol crescente: Mediana, posição central para número ímpar: Observe que a mediana é o valor 15 que está na quinta posição dos dados de nove elementos ordenados. Quando for obter a mediana em um conjunto de dados muito extenso, identificar visualmente o centro pode ser um pouco difícil, para isso calcular a posição central pode ser uma alternativa vantajosa. Estatística descritiva: medidas tendência central 4 A L F A C O N Assim, a posição central ou a posição da mediana (PMe) é calculada por n+1 divido por dois. O cálculo fornece a posição central do conjunto de dados, que nesse caso corresponde a posição 5. Caso o conjunto de dados tenha número par no total de elementos, o cálculo da mediana fica da seguinte forma, considerando outro exemplo hipotético: X = {0, 10, 15, 15, 20, 20, 25, 30} n = 8 Visualmente, a mediana está localizada: A posição da mediana está entre a quarta e quinta posição. Nesse caso, deve-se calcular a média entre os termos que estão no centro. Assim, a mediana é 17,5. Se fosse calcular a posição central o resultado seria: O valor 4,5 indica que a mediana está exatamente no centro entre o 4º termo e 5º termo do conjunto de dados em análise. 1.2 Mediana para dados ponderados: Para obter o valor da mediana em dados ponderados, a melhor informação que indica a posição do conjunto de dados está na frequência acumulada. Isso porque essa frequência acumula os valores das observações anteriores e, de certa forma, contabiliza o número de elementos e indica sua posição. Estatística descritiva: medidas tendência central 5 A L F A C O N Desse modo, basta identificar, na frequência acumulada, onde está a posição central e ver qual observação corresponde a essa posição. O valor que divide a distribuição de frequências em dois grupos com mesmo número de elementos estará na posição dada por: Neste caso, basta identificar a observação que tem frequência acumulada imediatamente superior à metade da soma das frequências absolutas (ou metade do número total de observações). Observe que até o valor de 15 kg/semana há 4 observações acumuladas, o valor de 20 kg/semana acumula 7 observações que inclui a posição 5ª que é imediatamente superior a 4,5. Desse modo, a observação 15 kg/semana é a mediana. O aluno não deve confundir a informação da posição dos dados na frequência com o valor correspondente ao fenômeno estudado. A mediana sempre será um valor referente ao fenômeno estudado e terá a mesma unidade de medida que o mesmo. A posição dos dados ordenados observada na frequência acumulada é apenas um indicativo para localizar a mediana. Se na questão forem fornecidos os dados da frequência acumulada relativa (Fri), é necessário identificar a posição que acumula 50% dos dados. Com isso, basta localizar a observação que acumula imediatamente superior a 50% de dados. Estatística descritiva: medidas tendência central 6 A L F A C O N 1.3 Mediana para dados agrupados: Para calcular a mediana em conjunto de dados agrupados, é preciso inicialmente identificar a classe mediana, ou seja, a classe com o intervalo de valores que engloba a mediana. A identificação da classe mediana funciona da mesma forma que a identificação da mediana nos dados ponderados. Como os dados são agrupados não é possível identificar o valor exato da mediana, e sim a classe em que ela se encontra. Para isso, basta localizar a classe imediatamente superior que acumula metade do total dos elementos () na frequência acumulada, ou então, que acumula um pouco mais de 50% na frequência acumulada relativa. Com isso, é possível inferir que a mediana está localizada entre o valor 10 kg/semana até 20 kg/semana. Para calcular o valor exato da mediana, é necessário utilizar o cálculo da interpolação linear. Quando se trabalha com dados agru- pados, utiliza-se esse método de cálculo para estimar o valor dentro do intervalo que corresponde proporcionalmente a posição que acumula um pouco mais da metade dos dados. O cálculo da interpolação linear trabalha com a ideia de que existe uma proporção entre a diferença dos valores obser- vados com a diferença de sua respectiva frequência acumulada (ou acumulada relativa)� Veja a relação matemática: Valor Observado (Xi) Quantidade acumulada (Fi) 10 2 Me 4,5 20 6 Estatística descritiva: medidas tendência central 7 A L F A C O N Essa relação de proporção é a interpolação linear. É possível associar que até o valor de 20 kg/semana acumula-se 6 observações, assim como, para 20 kg/semana acumula-se 4 observações. Logo, a divisão dessas diferenças estabelece uma relação de proporção com qualquer outra relação nesse conjunto de dados. Assim, é possível igualar com a divisão de diferenças que tenha a mediana como incógnita, sabendo que a mediana corresponde à frequência acumulada da metade dos dados, isto é, posição 4,5. Resolvendo a conta matemática, tem-se: Observe que o intervalo que vai de 0 até 10 kg/semana acumula até 2 observações, quase a metade da posição da mediana (que é 4,5). Desse modo, sabe-se que a mediana estará perto do meio do intervalo da classe mediana (10 até 20 kg/semana). Enquanto esse cálculo é efetuado, o aluno deve entender que nunca obterá um valor que extrapole o limite da classe mediana, assim se porventura ocorrer algum erro no cálculo quepasse desse valor, é interessante revisar os cálculos, pois certamente houve algum erro. A mediana, ao contrário da média, não depende de todos os valores observados; além disso, sofre baixa influência de valores extremos. Em adição, não podem ser aplicadas as variáveis qualitativas nominais, uma vez que não é possível ordenar os dados. A mediana é adequada quando os dados apresentam grande variabilidade ou distribuição assimétrica, além de valores extremos indefinidos. 2. Moda (mo) A moda é o valor observado que mais se repete no conjunto de dados. Em outras palavras, é o valor com maior fre- quência, ou então, valor com maior probabilidade de ocorrer. É também a medida descritiva que pode ser facilmente identificada em um gráfico de frequência absoluta (em qualquer tipo de representação gráfica), pois será sempre o pico (ponto mais alto) do gráfico. Ao contrário da Média e da Mediana, a Moda tem de ser obrigatoriamente um valor existente no conjunto de dados. Um conjunto de dados pode ser Unimodal, quando somente um valor tem mais frequência, exemplo: X = {2, 3, 4, 4, 4, 5, 8} Mo = 4 Pode ser Bimodal (ou Trimodal, assim por diante) quando duas observações possuem mais frequência do que as demais observações, exemplo: X = {2, 3, 4, 4, 4, 6, 7, 7, 7} Mo = 4 e 7 Estatística descritiva: medidas tendência central 8 A L F A C O N Quando o conjunto de dados não tem um valor que se repete, não existe moda e classifica-se como Amodal, exemplo: X = {2, 4, 7, 8, 9, 10 ,15} Mo = Ø 2.1 Moda para dados brutos: Quando a questão apresentar dados na forma bruta, para obter a moda, basta identificar o valor que mais se repete no conjunto de dados. Assim, conforme o exemplo: X = {0, 5, 10, 15, 15, 15, 20, 20, 30} Mo = 15 kg/semana A observação de 15 kg/semana repete-se três vezes e mais nenhuma outra observação tem esse mesmo número de observações. Logo, a moda é apenas 15 kg/semana. 2.2 Moda para dados ponderados: Em situação de dados ponderados, para identificar a observação que corresponde à moda, devem-se utilizar as infor- mações presente na tabela de frequência absoluta ou relativa. Praticamente, a observação que possuir maior valor de frequência absoluta ou relativa será a moda. Como é possível identificar na tabela a seguir: 2.3 Moda para dados agrupados: Como as observações estão agrupadas em classes, é necessário, primeiramente, identificar a classe que engloba a moda, denominada de classe modal. Para isso, basta identificar a classe com maior frequência absoluta ou relativa (igualmente como para dados ponderados). Portanto: Estatística descritiva: medidas tendência central 9 A L F A C O N Após essa etapa, é preciso calcular o valor pontual da moda, que estará dentro dos limites da classe modal. Para isso, existem quatro metodologias matemáticas diferentes que podem ser utilizadas. • Moda Bruta • Moda de Pearson • Moda de Czuber • Moda de King ͫ Moda Bruta: É o método mais simples; consiste em tomar como Moda o ponto médio da classe modal. Assim: ͫ Moda de Pearson: É calculada por meio da média e da mediana a partir da seguinte expressão: É a diferença entre três vezes o valor da mediana e duas vezes o valor da média. Logo, consoante aos cálculos da média e mediana para dados agrupados (Me = 21; X = 19,44): ͫ Moda de Czuber: Essa metodologia estima a moda baseado nos valores de frequência das classes modal, anterior a modal e posterior a modal. O cálculo é feito pela seguinte fórmula: Estatística descritiva: medidas tendência central 10 A L F A C O N Li: corresponde ao limite inferior da classe modal; Li = 10 h: corresponde à amplitude da classe modal; h =10 fModal: frequência absoluta da classe modal; fAnt: frequência anterior à classe modal; fPost: frequência posterior à classe modal; Desse modo, os valores correspondentes a cada frequência podem ser encontrados: Com isso, o cálculo é efetuado da seguinte forma: ͫ Moda de King: Estima a moda baseado nos valores de frequência das classes anterior à modal e posterior à modal. O cálculo é feito pela seguinte fórmula: Estatística descritiva: medidas tendência central 11 A L F A C O N Assim, o cálculo é procedido da seguinte maneira: Estatística descritiva: medidas tendência central 1. Mediana (me) 1.1 Mediana para dados brutos: 1.2 Mediana para dados ponderados: 1.3 Mediana para dados agrupados: 2. Moda (mo) 2.1 Moda para dados brutos: 2.2 Moda para dados ponderados: 2.3 Moda para dados agrupados:
Compartilhar