Baixe o app para aproveitar ainda mais
Prévia do material em texto
Medidas de dispersão e variabilidade APRESENTAÇÃO Nesta Unidade de Aprendizagem, estudaremos as medidas de dispersão e variabilidade de um conjunto de dados, as quais acompanham as medidas de tendência central representando e descrevendo o conjunto de dados. Com as medidas de dispersão e variabilidade, é possível entender a homogeneidade ou heterogeneidade dos dados. Bons estudos. Ao final desta Unidade de Aprendizagem, você deve apresentar os seguintes aprendizados: Definir as medidas de dispersão e variabilidade.• Diferenciar as medidas de amplitude de variação, variância, desvio-padrão, coeficiente de variação e amplitude entre quartis. • Analisar as medidas de dispersão e variabilidade.• DESAFIO Para auxiliar na compreensão desta Unidade de Aprendizagem, elaboramos um desafio! Construa um formulário com o nome da medida de dispersão e variabilidade e sua fórmula para execução do cálculo. Para realizar esta atividade, você deverá atender aos seguintes itens: 1 - Defina quais são as medidas de dispersão e variabilidade. 2 - Insira em uma folha o nome de cada uma dessas medidas de dispersão e variabilidade. 3 - Abaixo do nome da medida, insira a fórmula de cálculo de cada uma delas. INFOGRÁFICO O infográfico a seguir auxiliará na compreensão do conteúdo desta Unidade de Aprendizagem. CONTEÚDO DO LIVRO Neste capítulo, você vai estudar as medidas de dispersão e variabilidade de um conjunto de dados, as quais acompanham as medidas de tendência central, representando e descrevendo o conjunto de dados. Com as medidas de dispersão e variabilidade, é possível entender a homogeneidade ou a heterogeneidade dos dados. Aprofunde seus conhecimentos lendo o capítulo Medidas de Dispersão e Variabilidade, do livro Bioestatística, base teórica para esta Unidade de Aprendizagem. Boa leitura. BIOESTATÍSTICA Juliane Silveira Freire da Silva Medidas de dispersão e variabilidade Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Definir as medidas de dispersão e variabilidade. � Diferenciar as medidas de amplitude de variação, variância, desvio padrão, coeficiente de variação e amplitude entre quartis. � Analisar as medidas de dispersão e variabilidade. Introdução Neste capítulo, você vai estudar as medidas de dispersão e variabilidade de um conjunto de dados, as quais acompanham as medidas de tendência central, representando e descrevendo o conjunto de dados. Com as me- didas de dispersão e variabilidade, é possível entender a homogeneidade ou a heterogeneidade dos dados. O que são medidas de variabilidade? As medidas de variabilidade são analisadas em conjunto com as medidas de tendência central. Com as medidas de variabilidade, podemos verificar como os dados estão se comportando em torno da média, da moda e da mediana. Mesmo que dois conjuntos de dados tenham a mesma média, eles podem não ter o mesmo comportamento e a mesma variabilidade (Figura 1). Bioestatistica_LIVRO.indb 125 13/03/2018 09:16:44 Figura 1. Exemplo de diferentes distribuições, sendo 3 com médias iguais e variabilidades diferentes. Fonte: Professor Guru (2017). 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 -5 -4 -3 -2 -1 0 1 2 3 4 5 μ = 0. σ2 = 0,2 μ = 0. σ2 = 1,0 μ = 0. σ2 = 5,0 μ = 0. σ2 = 0,5 Não podemos interpretar as medidas de tendência central isoladamente. Para verificar se as medidas de variabilidade representam bem os dados, precisamos calcular e analisar as medidas de variabilidade. Diferenciação das medidas Amplitude A amplitude necessita do valor máximo e do valor mínimo do conjunto de dados, medindo, assim, a distância entre o maior e o menor valor. A amplitude só leva em consideração os extremos, não chega a comparar os valores da distribuição com a média desses dados. Medidas de dispersão e variabilidade126 Bioestatistica_LIVRO.indb 126 13/03/2018 09:16:44 a = valor máximo – valor mínimo = xmax – xmin Variância Diferente da amplitude, a variância leva em consideração todos os valores da distribuição e compara cada um deles com a média. A variância mede a distância de cada um dos valores em relação à média. Por uma questão matemática, precisamos elevar ao quadrado cada uma dessas distâncias para podermos eliminar o sinal. Depois disso, fazemos a média dos quadrados dessas diferenças. A fórmula para calcularmos a variância de uma amostra com dados em rol é a seguinte: x = ∑ x n Sendo: s2 = variância amostral xi = cada um dos i elementos da amostra x = média da amostra n = número de elementos da amostra Caso a variância esteja sendo calculada para os dados de uma população, representaremos esse valor pela letra grega sigma ao quadrado σ2. Em vez de dividirmos por n-1, dividimos o somatório por N, sendo que n é o número de elementos da amostra e N é o número de elementos da população. Supondo que há 4 notas de avaliações realizadas no semestre (7; 8; 6; 9). Nessa situação, a variância é dada por: Primeiramente, precisamos calcular a média: x = ∑ xi n = = 7 + 8 + 6 + 9 4 30 4 7,5 Então, o cálculo da variância para esses dados fica: S2 = ∑ (xi-x) 2 n-1 = (7 - 7,5)2 + (8-7,5)2 + (6 - 7,5)2 + (9 - 7,5)2 4 - 1 = 5 4 = 1,25 127Medidas de dispersão e variabilidade Bioestatistica_LIVRO.indb 127 13/03/2018 09:16:44 Podemos também calcular a variância quando temos uma tabela de dis- tribuição de frequências. Nesse caso, precisamos multiplicar cada uma das distâncias pelo número de vezes que se repete. Com base na Tabela 1, em que temos as notas de 30 alunos do curso de Bioestatística. Qual seria a variância para esses dados? Primeiramente, calculamos a média: x = ∑ ƒ· x ∑ ƒ = 246 30 = 8,2 Nota F Fr f.x 7 8 26,7 (7-8,2)2 . 8 = 11,52 8 12 40 (8-8,2)2 . 12 = 0,48 9 6 20 (9-8,2)2 . 6 = 3,84 10 4 13,3 (10-8,2)2 . 4 = 12,96 30 100 28,8 Tabela 1. Notas de 30 alunos do curso de Bioestatística. s2 = ∑ (xi-x) 2 n-1 = 28,8 29 = 0,9931 Desvio padrão Como você pode observar, a variância calcula a soma dos quadrados das distâncias em relação à média. Como elevamos todos os termos ao quadrado, a nossa unidade de medida também fica alterada. Se estivermos calculando a variância da altura de atletas do vôlei, por exemplo, a unidade de medida está em cm e, como o cálculo da variância de todos os elementos está elevada ao quadrado, então a unidade de medida passa a estar em cm2. Não podemos comparar a variância diretamente com a média ou com outras medidas, pois precisamos tirar a raiz da variância, e isso chamamos desvio padrão. Medidas de dispersão e variabilidade128 Bioestatistica_LIVRO.indb 128 13/03/2018 09:16:44 Sendo assim, o desvio padrão é a raiz quadrada da variância. A fórmula para calcularmos o desvio padrão de uma amostra com dados em rol é a seguinte: s =√∑ (xi - x)2n - 1 Onde: s = desvio padrão amostral xi = cada um dos i elementos da amostra x = média da amostra n = número de elementos da amostra Levando em consideração as 4 notas de avaliações realizadas no semestre (7,0; 8,0; 6,0; 9,0), o desvio padrão é dado por: A média para esses dados é igual a x = 7,5. Então, o cálculo do desvio padrão para esses dados fica: s = √ √√∑ (xi-x)2n -1 = (70 - 7,5)2 + (8,0 - 7,5)2 + (6,0 - 7,5)2 + (9,0 - 7,5)24 -1 = 54 = √1,25 = 1,12 A variabilidade da nota dos alunos em torno da média é de 1,12. Assim como a variância, podemos também calcular o desvio padrão quando temos uma tabela de distribuição de frequências. Continuamos a fazer o somatório das distâncias quadradas de acordo com a frequência de cada um dos resultados da variável. Com base nos dados da Tabela 1, em que constam as notas de 30 alunos do curso de Bioestatística. Qual seria o desvio padrão para esses dados? Sabemos que a média previamente calculada é igual a x = 8,2. s =√ √∑ (xi - x)2n-1 = 28,829 = √0,9931 = 0,9965 129Medidas de dispersão e variabilidade Bioestatistica_LIVRO.indb129 13/03/2018 09:16:45 No link ou código a seguir, você terá acesso a um vídeo que lhe ensinará a fazer os cálculos das medidas de tendência central e as medidas de variabilidade. https://goo.gl/TR3JcK Coeficiente de variação Quando quisermos comparar a variabilidade de duas ou mais amostras ou po- pulações, podemos fazer essa comparação apenas com o uso do desvio padrão, caso as diferentes amostras sejam da mesma variável e tenham médias iguais. Se estivermos comparando variáveis diferentes de um mesmo indivíduo, como, por exemplo, peso e altura de gestantes em uma amostra de 30 pessoas, e quisermos verificar se a menor variabilidade é para o peso ou para a altura, não podemos considerar apenas o desvio padrão, pois ele seguirá a escala de medida e a grandeza de cada uma das variáveis estudadas. Para essa verifi- cação, precisamos fazer uso do coeficiente de variação, que divide o desvio padrão pela média e multiplica por 100 para transformarmos em percentual. Além de utilizarmos o coeficiente de variação quando temos variáveis com unidade de medidas diferentes, também faremos uso dessa medida de variabilidade quando tivermos médias diferentes, mesmo que sendo a mesma variável, como verificar o aumento de peso de crianças em dois estados di- ferentes, cujas médias provavelmente não serão iguais. Então, para verificar a variabilidade dessas duas realidades, precisamos calcular o coeficiente de variação. CV = sx ∙ 100 Onde: CV = coeficiente de variação s = desvio padrão amostral x = média amostral Medidas de dispersão e variabilidade130 Bioestatistica_LIVRO.indb 130 13/03/2018 09:16:45 De acordo com as 4 notas das avaliações realizadas no semestre (7; 8; 6; 9), já calculamos a média x = 7,5 e s = 1,12. O cálculo do coeficiente de variação seria: CV = sx · 100 = 1,12 7,5 · 100 = 14,93% Também podemos calcular o coeficiente de variação para os dados da tabela 1, que já calculamos previamente a média x = 8,2 e s = 0,9965. CV = sx · 100 = 0,9965 8,2 · 100 = 12,15% Utilizando o coeficiente de variação, sempre que quisermos descobrir qual grupo de dados é mais homogêneo, ou seja, o que possui a menor variabilidade em torno da média, devemos optar pelo grupo de dados que tiver o menor percentual do coeficiente de variação. Caso o coeficiente de variação seja muito elevado, a média não será a melhor medida para representarmos os dados devido à alta variabilidade em torno dela. Amplitude interquartílica Essa medida é útil quando temos uma distribuição assimétrica. Os quartis são valores que dividem uma amostra de dados ordenados em quatro partes. As quatro partes são iguais a 25%. No primeiro quartil, denominado de Q1, temos 25% dos valores menores ou iguais a ele. No segundo quartil, deno- minado mediana, temos 50% dos valores menores ou iguais a ele. No terceiro quartil, denominado de Q3, temos 75% dos valores menores ou iguais a ele. A amplitude ou desvio interquartílico é dada pela diferença entre o primeiro e o terceiro quartil (Q1 – Q3). 131Medidas de dispersão e variabilidade Bioestatistica_LIVRO.indb 131 13/03/2018 09:16:45 Um pesquisador está interessado em descobrir as diferenças de comportamento quanto ao peso de bebês recém-nascidos nos dois extremos do país. Ele decide então coletar uma amostra do peso de 6 crianças de uma maternidade no interior da Bahia e outra amostra de 6 crianças nascidas em uma maternidade em Blumenau/SC. Os dados são os seguintes: Maternidade Bahia 2,5 2,4 2,6 2,8 2,6 2,4 Maternidade Santa Catarina 3,5 3,6 3,8 3,3 3,5 3,6 Primeiramente, calculamos a média para os dois conjuntos de dados. Maternidade Bahia: x = ∑ x n = 2,5 + 2,4 + 2,6 + 2,8 + 2,6 + 2,4 7 = 2,55 Maternidade Santa Catarina: x = ∑ x n = 3,5 + 3,6 + 3,8 + 3,3 + 3,5 + 3,6 7 = 3,55 Precisamos também calcular o desvio padrão. Maternidade Bahia: s = √ ∑(xi - x )2n -1 √= (2,5 - 2,55)2 + (2,4 - 2,55)2 + (2,6 - 2,55)2 + (2,8 - 2,55)2 + (2,6 - 2,55)2 + (2,4 - 2,55)25 √= 0,1155 = 0,15 Maternidade Santa Catarina: s = √ ∑(xi - x)2n -1 √= (3,5 - 3,55)2 + (3,6 - 3,55)2 + (3,8 - 3,55)2 + (3,3 - 3,55)2 + (3,5 - 3,55)2 + (3,6 - 3,55)25 √= 0,1355 = 0,16 Por fim, calculamos o coeficiente de variação, uma vez que as médias de peso das duas maternidades são diferentes. Medidas de dispersão e variabilidade132 Bioestatistica_LIVRO.indb 132 13/03/2018 09:16:46 Maternidade Bahia: CV = S x . 100 = 0,15 2,55 . 100 = 5,88% Maternidade Santa Catarina: CV = S x . 100 = 0,16 3,55 . 100 = 4,51% A maternidade que possui os pesos de recém-nascidos mais homogêneos é a maternidade de Santa Catarina, pois possui o menor coeficiente de variação. Observe que os dados poderiam enganar, pois, se olhássemos apenas para o desvio padrão, teríamos tirado a conclusão errada. 133Medidas de dispersão e variabilidade Bioestatistica_LIVRO.indb 133 13/03/2018 09:16:46 PROFESSOR GURU. Distribuição normal: modelos contínuos de distribuição de probabi- lidades. 2017. Disponível em: <http://professorguru.com.br/estatistica/distribuicoes-de- probabilidade/distribuicao-normal-de-probabilidades.html>. Acesso em: 26 out. 2017. Leituras recomendadas CALLEGARI-JACQUES, S. M. Bioestatística: princípios e aplicações. Porto Alegre: Art- med, 2007. FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. S. Epidemiologia clínica: elementos essenciais. 5. ed. Porto Alegre: Artmed, 2014. GLANTZ, S. A. Princípios de bioestatística. 7. ed. Porto Alegre: AMGH, 2014. JEKEL, J. F.; KATZ, D. L.; ELMORE, J. G. Epidemiologia, bioestatística e medicina preventiva. 2. ed. Porto Alegre: Artmed, 2005. Referência DICA DO PROFESSOR O vídeo em anexo explica as principais medidas de dispersão e variabilidade, a fim de esclarecer sua utilização e citar as principais diferenças no momento de descrever o conjunto de dados. Assista ao vídeo e associe as informações com tudo que foi descrito no capítulo do livro. Conteúdo interativo disponível na plataforma de ensino! EXERCÍCIOS 1) Qual a amplitude de variação do conjunto de dados abaixo? 6, 3, 4, 2, 9, 1, 2, 3, 4, 5, 7, 8 A) 8. B) 2. C) 3. D) 7. E) 5. 2) O que é o desvio-padrão (s ou DP)? A) É a raiz quadrada da variância. B) É a razão entre o desvio-padrão e a média de um conjunto de dados. C) Ele expressa a variação relativa (%) presente no conjunto de dados em relação à média. D) É a distância entre os quartis. Exemplo: Q3 – Q1. E) É uma medida de precisão da média amostral calculada que representa a precisão e a incerteza de uma única amostra como a estimativa da população. 3) Qual o conceito de variância? A) É a razão entre o desvio-padrão e a média de um conjunto de dados. Ela expressa a variação relativa (%) presente no conjunto de dados em relação à média. B) É a distância entre os quartis. Exemplo: Q3 – Q1. C) É a média dos quadrados dos desvios em torno da média. D) É a raiz quadrada da variância. E) É a distância entre o valor mais baixo e o mais alto do conjunto de dados. 4) O que é erro-padrão? A) É a razão entre o desvio-padrão e a média de um conjunto de dados. B) É uma medida de precisão da média amostral calculada que representa a precisão e a incerteza de uma única amostra como a estimativa da população. C) É a média dos quadrados dos desvios em torno da média. D) A média do conjunto de dados em torno da média, para mais ou para menos. E) É a raiz quadrada da variância. 5) O que é o coeficiente de variação relativa? A) É a raiz quadrada da variância. B) É a distância entre o valor mais baixo e o mais alto do conjunto de dados. C) É a razão entre o desvio-padrão e a média de um conjunto de dados. Ele expressa a variação relativa (%) presente no conjunto de dados em relação à média. D) É a distância entre os quartis. Exemplo: Q3 – Q1. E) É a média dos quadrados dos desvios em torno da média. NA PRÁTICA Veja agora uma situação prática da facilidade de uso das medidas de dispersão e variabilidade. SAIBA MAIS Para ampliar o seu conhecimentoa respeito desse assunto, veja abaixo as sugestões do professor: Medidas de posição e dispersão Conteúdo interativo disponível na plataforma de ensino! GLANTZ, S.A. Princípios de bioestatística. 7.ed. Porto Alegre: Artmed, 2014.
Compartilhar