Baixe o app para aproveitar ainda mais
Prévia do material em texto
Medidas de Tendência Central Professor Autor: Iderval Silva de Souza Módulo 2 Bioestatística 2 Sumário Conversa inicial �������������������������������������������������������������������������������������� 4 1� Medidas de Tendência Central: Média, Moda e Mediana Separatrizes ����� 5 2� Média de dados em tabelas de distribuição de frequência �������������� 7 3. Medidas de dispersão: variância e coeficiente de variação ������������ 16 4� Medidas de Assimetria �������������������������������������������������������������������� 23 Exercícios ���������������������������������������������������������������������������������������������� 25 Considerações Finais ���������������������������������������������������������������������������� 28 3 • Proporcionar ao aluno a oportunidade de conhecer e saber realizar cálculos com medidas de tendência central utilizando médias de dados e medidas de assimetria� Objetivo Geral Objetivos Específicos • Compreender a forma como se calcula as Medidas de Tendência Central; • Calcular a Média de dados em tabelas de distribuição de frequência; • Checar as Medidas de dispersão: variância e coeficiente de variação; • Resolver cálculos que envolvam Medidas de Assimetria� 4 Conversa inicial Olá! Seja bem-vindo (a) ao segundo módulo da disciplina de Bioestatística� Nesse momento de estudo, você conhecerá como ocorrem os cálculos que envolvem Medidas e Médias Estatísticas� Dedique-se aos estudos dessa disciplina, pois esses conhecimentos são imprescindíveis à formação do Gestor Hospitalar� De início, trago a você noções relacionadas às Medidas de Tendência Central, que são a Média, Moda e Mediana Separatrizes; no instante seguinte, será possível conhecer o passo a passo dos cálculos que envolvem Média de dados em Tabelas de Distribuição de Frequência; para o terceiro instante, veremos as Medidas de Dispersão: variância e coeficiente de variação; por último, você entrará em contato com as Medidas de Assimetria� Pronto, agora que você já conhece toda a nossa trajetória de estudos deste módulo, vamos aos trabalhos? Bons estudos! 5 1� Medidas de Tendência Central: Média, Moda e Mediana Separatrizes Para analisar e interpretar um conjunto de dados numéricos podemos utilizar um valor que represente esse conjunto, que é a média aritmética, moda ou mediana� Esse valor é apenas parte da informação dada, mas pode ser o suficiente para resumir a informação do conjunto de dados. Vejamos a primeira medida: Assim, para obtermos a média aritmética basta somarmos os valores de todos os dados e dividir o total pelo número deles. Como exemplo, podemos considerar o peso, em gramas, de 12 ratos com 30 dias de idade: 50 62 70 86 60 64 66 77 58 55 82 74 Média aritmética (Ma ou x barra) de um conjunto de n valores x1, x2,���,xn é o quociente entre a soma dos n valores e o número n de valores desse conjunto� 6 A média aritmética destes dados é feita somando todos os pesos e dividindo pelo número de ratos (12). A fórmula usada para encontrarmos a média aritmética é a seguinte: Notação: x (x-barra ou x-traço)� Somatório de xi, e de 1 a n – indica que todos os valores x i devem ser somados, desde o primeiro (x 1 ) até o n-ésimo (x n )� 7 2� Média de dados em tabelas de distribuição de frequência Se os dados estão em uma tabela de distribuição de frequências o cálculo da média é feito de outra forma� Consideremos a tabela abaixo: Peso ao nascer, em Kg O número de nascidos vivos nessa amostra é: n = 3 + 16 + 31 + 34 + 11 + 4 + 1 = 100 Classe Ponto Médio Frequência (f i ) 1,5├ 2,0 1,75 3 2,0├2,5 2,25 16 2,5├ 3,0 2,75 31 3,0├ 3,5 3,25 34 3,5├4,0 3,75 11 4,0├ 4,5 4,25 4 4,5├ 5,0 4,75 1 Para obter a média: Generalizando: 8 Vejamos a seguinte situação: Num laboratório trabalham 10 pessoas e nove operários que ganham um salário mínimo por mês, já o gerente que ganha 91 salários mínimos� O salário médio dos funcionários é: Salários mínimos A média de dez salários mínimos não representa bem o conjunto de dados, pois a maioria ganha um salário mínimo por mês� Logo, um salário mínimo representa melhor o conjunto de dados� Este valor é chamado de moda do conjunto e é nossa segunda medida de tendência central� Exemplos: Achar a moda dos conjuntos de dados abaixo: a� 6, 7, 5, 4, 3, 8, 9� Não existe moda. b� 3, 4, 4, 4, 5, 8, 8, 8� Aqui, as modas são 4 e 8� c� Indivíduos, segundo o tipo de sangue� Tipo de Sangue Frequência O 547 A 441 B 123 AB 25 A moda dessa amostra é sangue tipo O� D� azul, azul, azul� Neste caso não existe moda. Vejamos agora a terceira medida de tendência central de nosso curso: Portanto, Moda (M o ) de um conjunto de n valores é o valor que aparece com maior frequência� Há conjuntos que apresentam mais de uma moda e outros em que não existe uma moda� 9 Se a amostra é constituída por um número ímpar de dados, a mediana é o valor que fica no centro dos dados ordenados. Por exemplo, a mediana dos valores: 1, 2, 3, 5 e 9 é 3� Se a amostra é constituída por um número par de dados, a mediana é a média aritmética de dois valores que ficam na posição central dos dados ordenados. Por exemplo, a mediana dos valores: Quando existem na amostra valores repetidos, eles devem ser considerados� Assim, um conjunto com os seguintes valores: 1, 2, 1, 2, 0 tem mediana igual a 1, pois colocado em ordem decrescente temos a seguinte ordem 0, 1, 1, 2, 2; sendo a posição central ocupada pelo número 1. As medidas de tendência central são maneiras de resumir um conjunto de dados, mas são insuficientes para representar o conjunto� Separatrizes Neste módulo, já tivemos a oportunidade de conhecermos um pouco sobre medidas de tendência central como média, mediana, moda, mas não é raro que nos deparemos com a necessidade de dividir conjuntos numéricos em partes com mesmo número de elementos, assim como é feito na mediana. As medidas que possuem esta característica são chamadas de separatrizes e recebem o nome de acordo com a quantidade de partes em que é dividido o conjunto de dados� Mediana (Md) de um conjunto de n valores é o valor que ocupa a posição central quando esses dados são colocados em ordem crescente ou decrescente� Veja o link: Disponível em: https://www�todamateria�com�br/desvio-padrao/� Acesso em: 09/01/2020� Saiba Mais https://www.todamateria.com.br/desvio-padrao/ 10 Relato de Experiência Exemplo 1 Calcule os quartis da série: {5, 2, 6, 9, 10, 13, 15}� O primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: {2, 5, 6, 9, 10, 13, 15} O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9 que será = Q2� Temos agora {2, 5, 6} e {10, 13, 15} como sendo os dois grupos de valores iguais proporcionados pela mediana (quartil 2)�Para o cálculo do quartil 1 e 3 basta calcular as medianas das partes iguais provenientes da verdadeira Mediana da série (quartil 2)� Logo em {2, 5, 6} a mediana é = 5 � Ou seja: será o quartil 1� Em {10, 13, 15} a mediana é =13 � Ou seja: será o quartil 3� Exemplo 2 Calcule os quartis da série: {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13}� Quartis Os valores que fazem com que o conjunto de dados, ordenados de forma crescente, seja dividido em quatro partes iguais são chamados de Quartis, normalmente referenciados de Q1, Q2 e Q3� Note que são necessários somente três valores para dividir o conjunto de dados em quatro partes iguais� Cálculo do Quartil Esta divisão funciona da seguinte forma, o primeiro quartil Q1 é o número que deixa 25% das observações abaixo e 75% acima, enquanto que o terceiro quartil, Q3, deixa 75% das observações abaixo e 25% acima� É interessante observar que o segundo quartil (Q2) é na verdade a mediana, porque ele divide o conjunto de dados em duas partes iguais, ou seja, deixa 50% das observações abaixo e 50% das observações acima� Uma das partes dessa divisão contém os valores mais baixos do conjunto, cuja a mediana é, na verdade,o primeiro quartil, assim como na segunda parte da divisão, a que contém os valores mais altos, sua mediana é também o terceiro quartil� 11 A série já está ordenada, então calcularemos o Quartil 2 = Md = (5+6) /2 = 5,5� O quartil 1 será a mediana da série à esquerda de Md : {1, 1, 2, 3, 5, 5}� Q1 = (2+3)/2 = 2,5 O quartil 3 será a mediana da série à direita de Md : {6, 7, 9, 9, 10, 13}� Q3 = (9+9)/2 = 9 Percentil Assim como chamamos de quartis aos três valores que fazem com que o conjunto de dados, ordenados de forma crescente, seja dividido em quatro partes iguais, chamamos de percentis os noventa e nove valores que separam uma série em 100 partes iguais� Indicamos: P1, P2, ��� , P99� É evidente que P50 = Md ; P25 = Q1 e P75 = Q3� O cálculo segue a mesma estratégia do cálculo do quartil, ou seja, a determinação da mediana dos segmentos que são criados� Box plot O Box plot é uma representação gráfica em na qual se visualizam algumas características da amostra e é utilizado para avaliar a distribuição empírica dos dados� A partir das medidas de posição, mediana e quartil, ele evidencia informação importante sobre os dados� O Box Plot fornece informação sobre as seguintes características do conjunto de dados: locação, dispersão, assimetria, comprimento da cauda e outliers (medidas discrepantes). A figura a seguir ilustra um Box plot. Observe que o boxplot é delimitado pelo primeiro e terceiro quartil e pela mediana (Q2)� As hastes que saem do box podem se estender até os limites inferior (Li) e superior (Ls), assim determinados: Li = Q1-1,5*(Q 3 -Q 1 ); 12 Altura dos pacientes 1,59 1,79 1,68 1,80 1,58 1,60 1,69 1,73 1,87 1,68 1,85 Ordenando os valores, temos que: Desta forma, temos que o valor mínimo é 1,58, o valor máximo é 1,87� Para calcular a tri-média de 5% da amostra, retiramos o menor e o maior elemento da amostra e calculamos a média dos elementos restantes� O primeiro quartil é dado por 1,60 e o terceiro quartil é 1,80� Ls = Q3+1,5*(Q 3 -Q 1 )� Exemplo 1 (adaptado de: http://www�portalaction�com�br/estatistica- basica/31-boxplot)� Considere as medidas das alturas de 11 pacientes, dadas abaixo: Mínimo 1,58 1° Quartil 1,6 3° Quartil 1,8 Máximo 1,87 A construção do box plot é feita com base nos dados acima� Mediana http://www.portalaction.com.br/estatistica-basica/31-boxplot http://www.portalaction.com.br/estatistica-basica/31-boxplot 13 Podem ocorrer pontos fora destes limites, este pontos são considerados valores discrepantes (outliers) que podem ser representados por ser um traço, um asterisco ou um ponto� Exemplo 2 (retirado e adaptado de: http://www�escolaedti�com�br) Um engenheiro numa indústria química é responsável pela produção de acetona. Para avaliar a linha de produção, o gerente monitora o processo� Durante uma semana, 16 bateladas de acetona são produzidas e uma leitura por batelada é feita� Os resultados são apresentados na tabela abaixo: Batelada 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Leitura 6 24 12 11 34 32 28 19 31 22 29 58 15 5 17 25 Arrumamos os dados em ordem crescente (Rol): 5, 6, 11, 12, 15, 17, 19, 22, 24, 25, 28, 29, 31, 32, 34, 58 Desses dados calculamos: Q1=13�5 M=23 Q3=30 Min=5 Max=58 http://www.escolaedti.com.br 14 O boxplot pode ainda ser utilizado para uma comparação visual entre dois ou mais grupos� Isso pode ser conseguido desenhando-se os Box Plots para cada conjunto de dados, paralelamente, num mesmo gráfico. Veja o exemplo retirado e adaptado de: http://www�escolaedti�com�br�, que apresenta na tabela a seguir três conjuntos de dados referentes a viscosidade� Mistura 1 Mistura 2 Mistura 3 20�02 21�49 20�33 23�83 22�67 21�67 26�67 24�62 24�67 25�38 24�18 22�45 25�49 22�78 22�29 23�50 22�56 21�95 25�90 24�46 20�49 24�89 23�79 21�81 O Box plot é apresentado a seguir: http://www.escolaedti.com.br. 15 Os dados já estão organizados de forma crescente e a construção do box plot, após os devidos cálculos, para as três séries de dados, ficou assim: Note que as misturas apresentam níveis médios diferentes de viscosidade, decrescentes da mistura 1 para a mistura 3� 16 3. Medidas de dispersão: variância e coeficiente de variação Os dados distribuem-se em torno da média� Então o grau de dispersão de um conjunto de dados pode ser medido pelos desvios em relação à média� Se a média de idade de uma família é 30 anos, a pessoa com 54 anos terá um desvio em relação à média de 54 – 30 = 24 anos� E com 3 anos? 3 – 30 = -27 Para medir a dispersão dos dados em torno da média, os estatísticos usam a soma de quadrado dos desvios� Veja o cálculo: Desvio em relação à média é a diferença entre cada dado e a média do conjunto, representado por (x - x)� 17 Dados (x) Desvios (x-x̅) Quadrados dos desvios (x-x̅)2 X2 0 -5 25 0 4 -1 1 16 6 1 1 36 8 3 9 64 7 2 2 49 X = 5 Qualquer que seja o conjunto de dados, a soma dos desvios é sempre igual a zero� Então, para medir a dispersão dos dados em torno da média, os estatísticos usam a soma dos quadrados dos desvios (x - x)², ou melhor, a variância, que leva em consideração o tamanho da amostra� Onde n é o número de elementos de uma amostra. No caso de: Variância Usamos a letra S2 para indicar a variância, que é dada pela seguinte fórmula: 18 Podemos dizer, simplificando bastante, que o desvio padrão é quanto, em média, os valores do conjunto de dados se afastam do valor média do mesmo conjunto� Mede a dispersão em relação à média com a vantagem de não conter unidades de medidas� Assim, podemos comparar a variação entre duas variáveis com unidade de medidas diferentes� Desvio padrão É a raiz quadrada da variância, com sinal positivo� Coeficiente de variação É a razão entre o desvio padrão e a média� O resultado é multiplicado por 100, para que o coeficiente de variação seja dado em porcentagem (%). Clique nos links e saiba mais sobre desvio padrão: Disponível em: http://educacao�uol�com�br/disciplinas/matematica/ med ia - desv io -padrao - e -va r ianc ia -nocoes- de - es ta t i s t i ca �h tm Acesso em: 10/01/20� Disponível em: http://www�infoescola�com/estatistica/variancia-e- desvio-padrao/� Acesso em: 10/01/20� Disponível em: http://www�inf�furb�br/sias/saude/Textos/desvio_ padrao�htm� Acesso em: 10/01/20� Disponível em: http://www�assimsefaz�com�br/sabercomo/desvio- padrao-excel� Acesso em: 10/01/20� Saiba Mais http://educacao.uol.com.br/disciplinas/matematica/media-desvio-padrao-e-variancia-nocoes-de-estatistica.htm http://educacao.uol.com.br/disciplinas/matematica/media-desvio-padrao-e-variancia-nocoes-de-estatistica.htm http://www.infoescola.com/estatistica/variancia-e-desvio-padrao/ http://www.infoescola.com/estatistica/variancia-e-desvio-padrao/ http://www.inf.furb.br/sias/saude/Textos/desvio_padrao.htm http://www.inf.furb.br/sias/saude/Textos/desvio_padrao.htm http://www.assimsefaz.com.br/sabercomo/desvio-padrao-excel http://www.assimsefaz.com.br/sabercomo/desvio-padrao-excel 19 O nosso próximo assunto neste módulo tratará sobre medidas de assimetria, mas antes de entrarmos neste conteúdo é importante falarmos de média, variância e desvio padrão sob a ótica de dados agrupados em classes� Média O cálculo da média é similar ao já comentado: Onde: fi: frequência absoluta da classe; xi: ponto médio da classe, obtido através da média aritmética entre os limites da classe; n: número de elementos, equivalente a ∑fi. Variância O cálculo da variância leva em consideração o a frequência absoluta da classe: O uso da tabela facilita imensamente a organização dos dados na busca dos resultados� Vejamos um exemplo: Exemplo A tabela a seguir contém dados referentes a um estudo sobre a estatura de jovens da 8ª série do ensino fundamental� Clique nos links e saiba mais sobre coeficiente de variação: http://mundoeducacao�bol�uol�com�br/matematica/coeficiente- variacao�htm �Acesso em: 15/01/2020� Saiba Mais 20 Estatura Frequência Absoluta (fi) 1,55├1,572 1,57├1,59 6 1,59├1,61 7 1,61├1,63 8 1,63├1,65 2 Total 25 A partir desses dados, vamos obter a frequência relativa, a média e o desvio padrão mas para que fique claro, vamos montando a tabela passo a passo. Neste primeiro segmento da tabela é acrescentada uma coluna com os valores da frequência relativa, que já estudamos� Estatura Frequência Absoluta (fi) Frequência Relativa (fr) 1,55├1,57 2 0,08 1,57├1,59 6 0,24 1,59├1,61 7 0,28 1,61├1,63 8 0,32 1,63├1,65 2 0,08 Total 25 21 A próxima tabela traz também as colunas necessárias para o cálculo da média para dados agrupados em classes� Estatura Frequência Absoluta (fi) Frequência Relativa (fr) Ponto Médio (xi) xi * fi 1,55├1,57 2 0,08 1,56 3,12 1,57├1,59 6 0,24 1,58 9,48 1,59├1,61 7 0,28 1,6 11,2 1,61├1,63 8 0,32 1,62 12,96 1,63├1,65 2 0,08 1,64 3,28 Total 25 40,04 Agora vamos trabalhar para obter a variância e depois o desvio padrão� 22 Estatura F re q u ê n c i a Absoluta (fi) Frequência R e l a t i v a (fr) P o n t o Médio (xi) xi * fi (x i - x̅)² (x i - x̅)² fi x (x i - x̅)² 1,55 ⊢1,57 2 0,08 1,56 3,12 -0,0416 0,00173 0,0035 1,57 ⊢1,59 6 0,24 1,58 9,48 - 0,0216 0,00047 0,0028 1,59 ⊢1,61 7 0,28 1,6 11,2 -0,0016 0,00000 0,0000 1,61 ⊢1,63 8 0,32 1,62 12,96 0,0184 0,00034 0,0027 1,63 ⊢1,65 2 0,08 1,64 3,28 0,0384 0,00147 0,0029 Total 25 40,04 0,011936 23 4� Medidas de Assimetria Uma distribuição de frequência é denominada simétrica quando os seus valores de média, mediana e moda, coincidem, portanto, uma distribuição assimétrica ocorre quando há divergências nessas medidas de posição�Os exemplos a seguir, que ilustram essas condições, foram extraídos de: Coeficiente de Assimetria de Pearson O coeficiente de Pearson é uma forma de se quantificar a assimetria que não depende dos valores da variável em estudo� Quando dispomos de valores da média e do desvio-padrão, o cálculo é feito utilizando a expressão abaixo: 24 X̅= Média; M˳ = Moda; S = Desvio padrão da população; σ = Desvio padrão da amostra. As = 0 Distribuição Simétrica As < 0 Distribuição Assimétrica Negativa As > 0 Distribuição Assimétrica Positiva Medidas de Achatamento ou Curtose Denominamos Curtose o grau de achatamento de uma distribuição em relação à Distribuição Normal� É possível que quando pesquisar mais sobre o assunto você se depare com a distribuição Normal sendo chamada de Mesocúrtica (Meso = Meio, Central)� 25 Exercícios 13� São consideradas medidas de tendência central: a� Média, Mediana e Moda; b� Variância, Desvio Padrão, Coeficiente de Dispersão; c� Média, Moda e Desvio Padrão; d� Desvio Padrão, Média e Assimetria; e� Curtose Variância e Desvio Padrão� 14� Encontre a mediana da série: 25, 26, 26, 28, 30, 34, 38, 40, 40, 40, 45, 50, 52, 56� 15� Encontre os quartis da série 1, 14, 5, 19, 2, 12, 20, 22, 13� 16� A tabela a seguir apresenta o peso, em kg, de crianças de 1 dia à 2 anos: 2,9 3 3,3 6 3 11,5 6 8 4 9 10 4,4 6,5 8,3 7 9 4 3,3 2,8 9,8 Qual a mediana dos dados apresentados? 17� A tabela a seguir apresenta o peso, em kg, de crianças de 1 dia à 2 anos: Quais são os quartis Q1, Q2 e Q3 dos dados apresentados? 18� A tabela a seguir apresenta o peso, em kg, de crianças de 1 dia à 2 anos, e abaixo o Boxplot dos dados: 2,9 3 3,3 6 3 11,5 6 8 4 9 10 4,4 6,5 8,3 7 9 4 3,3 2,8 9,8 2,9 3 3,3 6 3 11,5 6 8 4 9 10 4,4 6,5 8,3 7 9 4 3,3 2,8 9,8 26 19� Quais os valores LI, Q1, Q2, Q3, LS que compoem o Boxplot? 20� Na medição da altura de 10 atletas de um time feminino de vôlei, algo muito raro aconteceu, todas as jogadoras apresentaram a mesma altura� Qual o valor do desvio padrão desse conjunto de dados? 21� Analisando as curvas abaixo marque a resposta correta� a� Curva I é simétrica - x̅ > med > mo; b� A curva II é assimétrica positiva - mo = σ² > x̅; c� A curva I é simétrica - x̅ = med > mo; d� A curva III é assimétrica positiva - x̅ > med > mo; 22� A tabela a seguir contém dados referentes a um estudo sobre ao peso de crianças de 1 dia à 12 anos�Qual o desvio padrão dos dados apresentados? Estatura Frequência Absoluta (fi) 2├ 4 5 4├ 6 9 6├ 8 12 8├ 10 8 10├ 12 6 27 23� A tabela a seguir apresenta a quantidade de pessoas que participaram voluntariamente de um programa de redução de peso, divididas por faixas etárias� Qual a média e o desvio padrão desses dados? Classes (fi) 18├ 24 31 25├ 34 45 35├ 44 58 45├ 54 62 55├ 64 47 65├ 74 11 total 254 28 Considerações Finais Chegamos ao final desse segundo módulo de Bioestatística. Nesse momento de estudo estivemos em contato com as Médias e Medianas compreendendo o quanto esses saberes são importantes para a gestão de uma organização hospitalar� Seguiremos adiante para vermos no módulo três noções relacionadas às probabilidades� Avante!
Compartilhar