Baixe o app para aproveitar ainda mais
Prévia do material em texto
Bioestatística Material Teórico Responsável pelo Conteúdo: Prof.ª Me. Priscila Bernardo Martins Revisão Textual: Prof.ª Dr.ª Luciene Oliveira da Costa Granadeiro Medidas de Tendência Central e de Dispersão • Introdução; • Medidas de Tendência Central; • Medidas de Dispersão; • Conclusão. • Ampliar seu conhecimento sobre as Medidas de Tendência Central (Média, Moda e a Mediana) e Medidas de Dispersão: Variância e Desvio Padrão. OBJETIVO DE APRENDIZADO Medidas de Tendência Central e de Dispersão Orientações de estudo Para que o conteúdo desta Disciplina seja bem aproveitado e haja maior aplicabilidade na sua formação acadêmica e atuação profissional, siga algumas recomendações básicas: Assim: Organize seus estudos de maneira que passem a fazer parte da sua rotina. Por exemplo, você poderá determinar um dia e horário fixos como seu “momento do estudo”; Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma alimentação saudável pode proporcionar melhor aproveitamento do estudo; No material de cada Unidade, há leituras indicadas e, entre elas, artigos científicos, livros, vídeos e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você tam- bém encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua interpretação e auxiliarão no pleno entendimento dos temas abordados; Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discus- são, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e de aprendizagem. Organize seus estudos de maneira que passem a fazer parte Mantenha o foco! Evite se distrair com as redes sociais. Mantenha o foco! Evite se distrair com as redes sociais. Determine um horário fixo para estudar. Aproveite as indicações de Material Complementar. Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma Não se esqueça de se alimentar e de se manter hidratado. Aproveite as Conserve seu material e local de estudos sempre organizados. Procure manter contato com seus colegas e tutores para trocar ideias! Isso amplia a aprendizagem. Seja original! Nunca plagie trabalhos. UNIDADE Medidas de Tendência Central e de Dispersão Introdução Vamos abordar um assunto importante a respeito da transmissão das infor- mações relativas à amostra ou à população estudada. Em se tratando dos dados obtidos, a condensação deles facilita a compreensão das características essenciais de uma amostra ou população. Para viabilizar essa etapa, usamos as medidas de tendência central e de dispersão. Hoje vamos conhecer um pouco mais sobre essas medidas. Figura 1 Fonte: Getty Images Medidas de Tendência Central As medidas de tendência central são confiáveis quanto mais representativo for o conjunto de elementos da amostra ou da população. Se o conjunto de elementos for bem selecionado, se guardar características semelhantes às características da popu- lação que foi extraída, e se for suficientemente grande, os dados refletirão melhor o que poderíamos encontrar na população. Pode-se dizer também que essas medi- das – de tendência central e de dispersão – são uma primeira caracterização dos conjuntos populacionais ou amostrais. Média Aritmética A média aritmética consiste na soma dos valores de um conjunto de dados, di vididos pelo número de elementos. Veja o exemplo abaixo. Considere o seguinte conjunto de dados: 11 10 10 12 23 24 30 8 9 A média aritmética será = 11 + 10 + 10 + 12 + 23 + 24 + 30 / 7 = 17,14 Observação 1: Frequentemente a média aritmética vem acompanhada de outra medida, o desvio padrão. Essa é uma medida de dispersão e indica o quanto os valores se afastam ou se aproximam da média. Observação 2: A média aritmética é muito infl uenciada por valores extremos, ou seja, valores muito menores ou maiores infl uenciam de forma marcante o valor real da média. Figura 2 Fonte: Getty Images Dividir a conta em um bar (“rachar a conta”) é um bom exemplo prático de mé- dia aritmética. A fórmula para cálculo da média aritmética é: x x x x n x n n i i n = + + + = = ∑ 1 2 1 Onde o X com uma barra significa média aritmética de uma amostra e n o número de indivíduos da amostra. Exercício resolvido: Uma nutricionista decidiu investigar a circunferência abdominal de 10 gerentes de uma grande empresa multinacional interessados em perder peso por meio de um programa de reeducação alimentar. As medidas seguem abaixo: Gerentes 1 2 3 4 5 6 7 8 9 10 Circunferência 88 83 79 76 78 70 80 82 86 105 9 UNIDADE Medidas de Tendência Central e de Dispersão Devemos primeiro determinar qual o tamanho da amostra (n): Como no caso temos 10 gerentes, então dizemos que n = 10. Cada gerente representa um valor de x, como segue: x1 = 88 x2 = 83 x3 = 79 x4 = 76 x5 = 78 x6 = 70 x7 = 80 x8 = 82 x9 = 86 x10 = 105 Substituindo na fórmula, teremos: x x x = + + + + + + + + + = = 88 83 79 76 78 70 80 82 86 105 10 827 10 82 7, Dizemos então que: a média aritmética da circunferência abdominal dos 10 gerentes é de 82,7 cm. Mediana A mediana é outra medida que indica a caracterização do conjunto de valores. Ela indica o valor que divide ao meio o conjunto de valores, ou seja, indica o valor que ocupa a posição central desse conjunto, não sofrendo qualquer interfe rência dos valores extremos. O seu cálculo depende da ordenação dos dados, o que corresponde a colocá-los em ordem crescente ou decrescente. Continuando com o exemplo usado no calculo da média aritmética: 10 11 11 10 10 12 23 24 30 11 10 12 23 24 10 10 11 12 23 24 30 A mediana seria assim calculada: Segue um exemplo com n par: 10+12=22 22 2=11 Essa é a mediana, pois é o valor central de um conjunto de dados. Quando o número de valores for ímpar (como no caso acima), a mediana será sempre o valor do meio. Como o n é par, soma-se os dois valores centrais e divide-se por “2”. Portanto, nesse exemplo, 11 é a mediana da distribuição apresentada. Moda A moda é o valor que ocorre com maior frequência. Essa medida, juntamente com a média e a mediana, ajudam a compreender o padrão homogêneo dos dados. Quando essas três medidas estão próximas, podemos dizer que o conjunto de dados é homogêneo, ou seja, não há valores extremos, mas sim uma tendência de que boa parte dos números se localizem próximos a essas três medidas. Figura 3 Fonte: Getty Images 11 UNIDADE Medidas de Tendência Central e de Dispersão Se um conjunto de dados possui um único valor que se repete com maior frequên- cia, diz-se que o conjunto é unimodal; quando dois números aparecem com maior frequência, é bimodal; se três ou mais números aparecem com maior frequên cia, é multimodal. A ausência de moda caracteriza um conjunto amodal. Veja o exemplo abaixo. Considere o seguinte conjunto de dados: 0 1 1 2 3 4 4 4 5 Analisando os dados, observa-se que o número 4 é o número que se repete com maior frequência (3 vezes). Dessa forma, dizemos que o conjunto é unimodal. Vamos analisar outro conjunto de dados: 0 1 1 1 3 4 4 4 5 Analisando os dados, observa-se que os números 1 e 4 se repetem com maior frequência (3 vezes cada um). Dessa forma, dizemos que o conjunto é bimodal. Medidas de Dispersão As medidas de tendência central, vistas anteriormente, ajudam a explicar a ten- dência central dos dados, ou seja, o quanto esse conjunto é homogêneo. Essas medidas precisam estar acompanhadas de outras informações que indiquem a VARIABILIDADE dos dados, isto é, o quanto os valores divergem em relação aos valores de caracterização geral da população ou amostra. Considere a situação apresentada no livro Introdução à bioestatística, da autora Sônia Vieira (2008): Considerando 2 domicílios, sendo que em um deles moram 7 pessoas , todas com 22 anos de idade.A média de idade será de 22 anos. No ou- tro domicilio, poderíamos ter a mesma média de idade, no entanto, nesse segundo domicilio, moram uma garota de 17 anos, um garoto com 23 anos, duas crianças de 2 e 3 anos, respectivamente, além de uma mulher de 38 anos, outra criança de 8 anos e uma senhora de 65 anos. Nesse exemplo acima, temos dois conjuntos de valores, cuja variabilidade é diferente, embora a média seja a mesma. No primeiro conjunto de valores, a variabilidade é bem menor, condição contrária à que ocorre no segundo grupo , no qual a variabilidade é maior, pois as idades variam de 2 até 65 anos. 12 13 Quartis e Percentis Já aprendemos que a mediana é o valor que divide ao meio o conjunto de valores. Poderíamos dizer também que a mediana indica que, abaixo daquele valor, temos 50% das observações dos valores. Mas há situações em que podemos dividir o conjunto de valores em partes menores: quartis, decis e percentis indicam essa possibilidade. Sendo assim, o primeiro quartil indica que 25% dos valores estão abaixo desse valor; o segundo quartil indica que 50% da amostra está abaixo desse valor; e assim por diante. Veja o modelo abaixo: 1º quartil 2º quartil 3º quartil 4º quartil 25% 25% 25% 25% 50% DOS VALORES 75% DOS VALORES Já os percentis consideram as posições dividindo o conjunto de valores em 100 partes. Da mesma forma que o quartil, o percentil 70, por exemplo, indica que 70% dos valores de um conjunto encontram-se abaixo desse valor. Observação: percebam, no modelo esquemático abaixo, que uma posição (ou valor) pode ser indicada de mais de uma forma. 25% 25% 25% 25% 50% 2º quartil Percentil 5050% 13 UNIDADE Medidas de Tendência Central e de Dispersão Amplitude, Mínimo e Máximo A amplitude explica a variabilidade de valores, e por isso é considerada uma medida de dispersão. É definida como a diferença entre o maior e o menor valor de um determinado conjunto de valores. Menor, também chamado de mínimo, é o menor valor de um determinado con- junto de valores. Maior, também chamado de máximo, é o maior valor de um determinado con- junto de valores. Maior A M P L I T U D E menor_ Importante! Assim como a média, a amplitude é muito influenciada por valores extremos, isto é, um valor muito baixo ou muito alto altera facilmente essa medida e pode, em determinados casos, não representar a real variabilidade do conjunto de valores, pois houve o compro- metimento em razão desse(s) valor(es) extremo(s). Importante! Variância e Desvio Padrão Essas duas medidas indicam a variabilidade, distância dos valores em torno do valor médio encontrado para um determinado conjunto de dados (valores). Se meno res, a variância e o desvio padrão indicam pouca variabilidade dos valores, caracteri- zando um conjunto de valores mais homogêneo, ou seja, de variabilidade pequena. Considere as informações abaixo: Variância x x n DesvioPadrão x x n somatória x o v = −( ) − = −( ) − ∑ ∑ ∑2 2 1 1 : : aalor de cada uma das observações x a média da amostra n : : o número de obsservações (tamanho da amostra) Perceba que tanto a variância quanto o desvio padrão partem do cálculo da distância de um valor em relação a media (x – x). Faz-se a somatória dessas distâncias e, por “necessidades” matemáticas, eleva-se ao quadrado (para eliminar os valores negativos das distâncias) ou extrai-se a raiz quadrada (pois queremos eliminar a elevação ao quadrado de uma determinada medida). 14 15 Defi niremos como variância a soma dos quadrados dos desvios de cada observação em relação a media, dividida por (n – 1). E desvio padrão como a raiz quadrada da variância. Exercício Resolvido: Vamos considerar o seguinte conjunto de notas de um determinado aluno: 5,0 6,0 5,0 9,0 Calcule a Variância e o Desvio Padrão. Variância é representada por s. Pela fórmula dada, precisamos subtrair cada valor de x da média da amostra, somar todos esses valores, elevar o resultado ao quadrado e depois dividir por n – 1. Vamos fazer passo a passo: Abaixo a fórmula do desvio padrão: s x x n = − − ∑( )2 1 Vamos calcular em primeiro lugar a média: x x x = ÷ = ÷ = (5+6+5+9) 4 425 6 25, Vamos subtrair cada valor de x da média amostral: x x ( x –x ) 5 – 6,25 –1,25 6 – 6,25 –0,25 5 – 6,25 –1,25 9 – 6,25 +2,75 Notas dos alunos Média calculada x menos a média Agora, vamos elevar os valores obtidos ao quadrado: x x ( x –x ) ( x –x )2 5 – 6,25 –1,25 1,5625 6 – 6,25 –0,25 0,0625 5 – 6,25 –1,25 1,5625 9 – 6,25 +2,75 7,5625 15 UNIDADE Medidas de Tendência Central e de Dispersão Precisamos, então, somar os quadrados obtidos: x x ( x –x ) ( x –x )2 5 – 6,25 –1,25 1,56 6 – 6,25 –0,25 0,0625 + 5 – 6,25 –1,25 1,5625 9 – 6,25 +2,75 7,5625 = 10,75 A fórmula pede que esse valor (10,75), seja dividido por n – 1. Em nosso exemplo, n = 4 (quatro notas), então 4 – 1 = 3 Então: 10,75 ÷ 3 = 3,58 Portanto: s (variância) é igual a 3,58. O desvio padrão é representado por s2. s2 é igual a raiz quadrada de s (variância), então: s2 = s s2 = 3 58, s2 = 1,89 ou seja, o desvio padrão das notas desse aluno é 1,89, sendo que a média foi 6,25. Coeficiente de Variação Essa medida indica a dispersão dos valores em relação à média. Para se calcular o coeficiente de variação, usamos o desvio padrão e a média: CV= desvio padrão / média x 100 Percebam que o CV não possuirá unidade de medida (é adimensional). Dessa forma, podemos comparar a dispersão de valores para dados quantitativos que utilizaram medidas diferentes, como metros e quilogramas. O uso de coeficientes não é tão frequente quanto o uso das outras medidas discutidas neste capítulo. Os coeficientes são importantes na elaboração de indicadores de saúde. 16 17 Importante! As medidas de tendência central e de dispersão são úteis na compreensão e caracteri- zação dos dados populacionais ou amostrais. A apresentação dessas medidas ajuda a entender o caráter homogêneo ou não dos dados, bem como a forma de dispersão dos mesmos em relação a um determinado valor médio. Em Síntese 17 UNIDADE Medidas de Tendência Central e de Dispersão Material Complementar Indicações para saber mais sobre os assuntos abordados nesta Unidade: Vídeos Moda, Média e Mediana https://youtu.be/UfupcG1ax6U Média e Mediana de dados agrupados https://youtu.be/7djAJFHYyno Propriedades da Média e Desvio Padrão https://youtu.be/3swCXxdYwdI Cálculo do desvio padrão e da variância https://youtu.be/PEN2M_eo6SY 18 19 Referências ARANGO, H. G. Bioestatística – Teórica e Computacional. 2. ed. Rio de Janeiro: Guanabara Koogan, 2005. (acompanha CD demonstrativo) VIEIRA, S. Princípios de Estatística. São Paulo: Pioneira Thomson Learning, 2003. VIEIRA, S. Introdução à Bioestatística. 4. ed. Rio de Janeiro: Elsevier, 2008. TRIOLA, M. F. Introdução à Estatística. Rio de Janeiro: LTC, 2005. 19
Compartilhar