Baixe o app para aproveitar ainda mais
Prévia do material em texto
Medidas de tendência central Medidas de tendência central 3.Medidas descritivas Outra maneira de se resumir os dados de uma variável quantitativa, além de tabelas e gráficos, é apresentá-los na forma de valores numéricos, denominados medidas descritivas. Estas medidas, se calculadas a partir de dados populacionais, são denominadas parâmetros e se calculadas a partir de dados amostrais são denominadas estimadores ou estatísticas. 3.1.Medidas de tendência central As medidas de tendência central são assim denominadas por indicarem um ponto em torno do qual se concentram os dados. 3.1.1.Média A média aritmética ( x ) é a soma de todos os valores observados da variável dividida pelo número total de observações. É a medida de tendência central mais utilizada para representar a totalidade de dados. Seja (x1, x2, x3, ..., xn), a média é dada pela seguinte expressão: n x x n 1i i∑ = = Onde: x = a média das observações no conjunto de dados. ∑ = n 1i i x = significa que devemos somar todos os elementos de todas as observações no grupo, de x1 até o valor de xn. AULA 3 Medidas de tendência central n = representa a totalidade de observações da amostra. Exemplo: Dado o conjunto: S = {1, 2, 3, 4, 5} X1=1; x2=2; x3=3; x4=4; x5=5 A média para o determinado conjunto de dados será: A média pode ser utilizada como medida de tendência central tanto para dados discretos quanto contínuos. Geralmente, no entanto, não é apropriada para dados nominais nem para dados ordinais. É valido ressaltar que para esses dados, os números são apenas atributos, e modo que mesmo se representássemos os tipos sanguíneos do sistema ABO (A, B, AB e O) pelos números 1, 2, 3, e 4; a média do tipo sanguíneo seria o valor 1,8, e esse por sua vez, não teria nenhum significado. Uma exceção a essa regra é quando utilizamos dados dicotômicos (presença ou ausência, sim ou não, masculino ou feminino), e os dois resultados possíveis são representados por 1 ou 0, nessa situação, a média das observações é igual a proporção de 1s ou de 0s no conjunto de dados, dependendo da classe da variável que será analisada. A média apresenta algumas propriedades que são características dessa media de tendência central, são elas: 1) a média é um valor que depende de todas as observações. n x x n 1i i∑ = = Medidas de tendência central 2) a média é afetada por valores extremos. S1 = {1, 2, 3, 4, 5} x1=1; x2=2; x3=3; x4=4; x5=5 S2 = {1, 2, 3, 4, 10} x1=1; x2=2; x3=3; x4=4; x5=10 3) qualquer modificação nos dados fará com que a média fique alterada. Isto quer dizer que somando-se, subtraindo-se, multiplicando-se ou dividindo-se uma constante a cada valor observado, a média ficará acrescida, diminuída, multiplicada ou dividida desse valor. S1 = {1, 2, 3, 4, 5} x1=1; x2=2; x3=3; x4=4; x5=5 S1 (alt) = {1+1, 2+1, 3+1, 4+1, 5+1} x1=2; x2=3; x3=4; x4=5; x5=6 Medidas de tendência central 4) a soma da diferença de cada valor observado em relação à média é zero, ou seja, a soma dos desvios é zero, da seguinte forma, 0=−∑ ) x( xi S1 = {1, 2, 3, 4, 5} x1=1; x2=2; x3=3; x4=4; x5=5 Onde: {(1-3)+(2-3)+(3-3)+(4-3)+(5-3)}= 0 3.1.1.1.Média em uma tabela de distribuição de frequências Se os dados estão em uma tabela de distribuição de frequência, o calculo é da seguinte forma: Tabela. Ponto médio e frequência absoluta de nascidos vivos segundo o peso ao nascer, em quilogramas (Kg) Classe Ponto médio Frequência absoluta 1,5 ι— 2,0 1,75 3 2,0 ι— 2,5 2,25 16 2,5 ι— 3,0 2,75 31 3,0 ι— 3,5 3,25 34 3,5 ι— 4,0 3,75 11 4,0 ι— 4,5 4,25 4 4,5 ι— 5,0 4,75 1 Soma 100 Medidas de tendência central O número de nascidos vivos na amostra é: 100 indivíduos. Para obter a média dos pesos ao nascer de nascidos vivos de uma amostra, onde os dados estão representados em uma tabela de distribuição de frequência, multiplica-se o ponto médio de cada classe pela respectiva frequência, somam-se os produtos e divide- se a soma por n. Então a média para os dados da tabela de distribuição de frequência supracitada será: 3.1.2.Mediana A mediana de um conjunto de dados é o valor que está localizado na posição central quando o conjunto de dados está organizado em rol. A mediana mede o centro de um conjunto de dados ordenado, dividindo-o em duas partes iguais. Se o conjunto de dados tem um número ímpar de entradas a mediana é a entrada de dados do meio. Se o conjunto de dados tem um número par de entradas, a mediana e a média das duas entradas, a mediana é a média dos dados centrais. Suponha o seguinte conjunto de dados, já organizado em rol (sequencia em ordem crescente): 128,45; 134,67; 142,00; 142,14; 143, 98; 169,41; 176,90; 180,34; 185,21 O conjunto de dados acima, apresenta um número impar de observações (n=9), dessa forma a mediana (Md) é estimada da seguinte Medidas de tendência central forma: Md=[(n+1)/2], onde Md=5, esse resultado significa que, para essa amostra a mediana é o valor que ocupa a 5º posição, ou seja, 143,14. Supondo nesse momento que o conjunto de dados seja: 128,45; 134,67; 142,00; 142,14; 143, 98; 169,41; 176,90; 180,34; 185,21; 186,01 O conjunto de dados acima, apresenta um número par de observações (n=10), dessa forma a mediana (Md) é estimada pela média de ambos valores centrais, (143,98+169,41)/2 = 156,69. É valido ressaltar que a mediana, de uma amostra onde o valor de n seja par, o valor dela pode estar ou não contido dentro dos valores da amostra. O calculo da mediana leva em consideração somente a ordenação e a magnitude relativa das observações em um conjunto de dados, dessa forma, a mesma não é afetada por valores discrepantes de uma amostra. Por exemplo: Situação 1 128,45; 134,67; 142,00; 142,14; 143, 98; 169,41; 176,90; 180,34; 350,89 A média: 176,06 A moda: 143,98 Situação 2 128,45; 134,67; 142,00; 142,14; 143, 98; 169,41; 176,90; 180,34; 185,21 A média: 155,90 A moda: 143,98 Foi possível observar que a mediana não foi influenciada em ambas as situações pela presença do valor discrepante, em contrapartida, a média apresentou valores distintos em ambas amostras. Medidas de tendência central 3.1.2.1.Mediana em uma tabela de distribuição de frequências Nessa situação, devemos determinar o ponto do intervalo em que está compreendida a mediana. Tomando como exemplo, os valores da seguinte tabela: Tabela. Ponto médio, frequência absoluta, frequência relativa e frequência relativa acumulada da estatura de 40 pessoas atendidas durante um dia em uma unidade de saúde Classe Ponto médio Frequência absoluta Frequência absoluta acumulada (%) 150 ι— 154 152 4 4 154 ι— 158 156 9 13 158 ι— 162 160 11 24 162 ι— 166 164 8 32 166 ι— 170 168 5 37 170 ι— 174 172 3 40 Soma 40 - O calculo da mediana em uma tabela de distribuição é realizado da seguinte forma: Primeiro devemos deve-se determinar a classe mediana, a referida classe será aquela correspondente a frequência absoluta acumulada imediatamente superior ao valor encontrado na seguinte expressão: Dessa forma, será a média do somatórioda frequência absoluta, ou seja, 40/2= 20. Medidas de tendência central O valor da expressão resulta em 20, e como não há nenhuma classe de frequência absoluta acumulada, com esse valor, a classe mediana será aquela que apresentará imediatamente o valor superior a esse, no caso a classe será aquela que apresentará o valor 24, na frequência absoluta acumulada. Sabemos que o valor da mediana está localizado na terceira classe, com base nesses conhecimentos aplicamos a seguinte expressão: Dessa forma, o valor da mediana nessa distribuição frequência é o valor de 160,54. 3.1.3.Moda A moda de um conjunto de dados é a observação que ocorre com maior frequência. A moda pode ser obtida para qualquer tipo de dados, como por exemplo, para dos dados expressos abaixo, neste caso a classe modal é o sangue do tipo O, pois apresenta a maior frequência observada em relação a todas as classes. Medidas de tendência central Tabela. Frequência do tipo de sangue do sistema ABO Tipo de sangue Frequência O 547 A 441 B 123 AB 25 É relevante salientar que um conjunto de dados pode apresentar todos seus elementos com a mesma frequência absoluta, e neste caso não existirá um valor modal, o que significa que a distribuição será classificada como amodal. Podem ocorrer casos em que a sequência de observações apresente vários elementos com frequência iguais, implicando numa distribuição plurimodal. O uso da moda é mais indicado quando se deseja obter, rapidamente, uma medida de tendência central. Outro aspecto que favorece a utilização da moda é que seu valor não é afetado pelos valores extremos do conjunto de dados analisado. 3.1.3.1.Moda em uma tabela de distribuição de frequências A classe que apresenta a maior frequência é denominada classe modal (Mo). Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal, pelos valores da tabela abaixo, podemos observar que a classe que apresenta a maior frequência é a terceira classe, para determinar a moda em uma tabela de distribuição de frequência, a frequência absoluta da distribuição. Há várias metodologias para encontrar o valor da moda, o método mais simples obtém um valor denominado de moda bruta, para essa estimativa utilizamos a seguinte expressão: Mo = (L inferior da classe modal + L superior da classe modal)/2 Mo = 158+162/2 = 160 Medidas de tendência central Tabela. Ponto médio, frequência absoluta, frequência relativa e frequência relativa acumulada da estatura de 40 pessoas atendidas durante um dia em uma unidade de saúde. Classe Ponto médio Frequência absoluta Frequência absoluta acumulada (%) 150 ι— 154 152 4 4 154 ι— 158 156 9 13 158 ι— 162 160 11 24 162 ι— 166 164 8 32 166 ι— 170 168 5 37 170 ι— 174 172 3 40 Soma 40 -
Compartilhar