Baixe o app para aproveitar ainda mais
Prévia do material em texto
Podemos também calcular a variância quando temos uma tabela de dis- tribuição de frequências. Nesse caso, precisamos multiplicar cada uma das distâncias pelo número de vezes que se repete. Com base na Tabela 1, em que temos as notas de 30 alunos do curso de Bioestatística. Qual seria a variância para esses dados? Primeiramente, calculamos a média: x = ∑ ƒ · x ∑ ƒ = 246 30 = 8,2 Nota F Fr f.x 7 8 26,7 (7 – 8,2)2 · 8 = 11,52 8 12 40 (8 – 8,2)2 · 12 = 0,48 9 6 20 (9 – 8,2)2 · 6 = 3,84 10 4 13,3 (10 – 8,2)2 · 4 = 12,96 30 100 28,8 Tabela 1. Notas de 30 alunos do curso de Bioestatística. 2 = ∑ ( ― )2 ∙ ― 1 = 28,8 29 = 0,9931 Desvio padrão Como você pode observar, a variância calcula a soma dos quadrados das distâncias em relação à média. Como elevamos todos os termos ao quadrado, a nossa unidade de medida também fica alterada. Se estivermos calculando a variância da altura de atletas do vôlei, por exemplo, a unidade de medida está em cm e, como o cálculo da variância de todos os elementos está elevada ao quadrado, então a unidade de medida passa a estar em cm2. Não podemos comparar a variância diretamente com a média ou com outras medidas, pois precisamos tirar a raiz da variância, e isso chamamos desvio padrão. Medidas de dispersão e variabilidade4 Sendo assim, o desvio padrão é a raiz quadrada da variância. A fórmula para calcularmos o desvio padrão de uma amostra com dados em rol é a seguinte: s =√∑ (xi – x)2 n – 1 Onde: s = desvio padrão amostral xi = cada um dos i elementos da amostra x = média da amostra n = número de elementos da amostra Levando em consideração as 4 notas de avaliações realizadas no semestre (7,0; 8,0; 6,0; 9,0), o desvio padrão é dado por: A média para esses dados é igual a x = 7,5. Então, o cálculo do desvio padrão para esses dados fica: s = √ √√∑ (xi – x)2 n – 1 = (7,0 – 7,5)2 + (8,0 – 7,5)2 + (6,0 – 7,5)2 + (9,0 – 7,5)2 4 – 1 = 5 3 = √0,67 = 1,29 A variabilidade da nota dos alunos em torno da média é de 1,29. Assim como a variância, podemos também calcular o desvio padrão quando temos uma tabela de distribuição de frequências. Continuamos a fazer o somatório das distâncias quadradas de acordo com a frequência de cada um dos resultados da variável. Com base nos dados da Tabela 1, em que constam as notas de 30 alunos do curso de Bioestatística. Qual seria o desvio padrão para esses dados? Sabemos que a média previamente calculada é igual a x = 8,2. = ∑ ( ― )2 ∙ ― 1 = 28,8 29 = 0,9931 = 0,9965 5Medidas de dispersão e variabilidade No link ou código a seguir, você terá acesso a um vídeo que lhe ensinará a fazer os cálculos das medidas de tendência central e as medidas de variabilidade. https://goo.gl/TR3JcK Coeficiente de variação Quando quisermos comparar a variabilidade de duas ou mais amostras ou po- pulações, podemos fazer essa comparação apenas com o uso do desvio padrão, caso as diferentes amostras sejam da mesma variável e tenham médias iguais. Se estivermos comparando variáveis diferentes de um mesmo indivíduo, como, por exemplo, peso e altura de gestantes em uma amostra de 30 pessoas, e quisermos verificar se a menor variabilidade é para o peso ou para a altura, não podemos considerar apenas o desvio padrão, pois ele seguirá a escala de medida e a grandeza de cada uma das variáveis estudadas. Para essa verifi- cação, precisamos fazer uso do coeficiente de variação, que divide o desvio padrão pela média e multiplica por 100 para transformarmos em percentual. Além de utilizarmos o coeficiente de variação quando temos variáveis com unidade de medidas diferentes, também faremos uso dessa medida de variabilidade quando tivermos médias diferentes, mesmo que sendo a mesma variável, como verificar o aumento de peso de crianças em dois estados di- ferentes, cujas médias provavelmente não serão iguais. Então, para verificar a variabilidade dessas duas realidades, precisamos calcular o coeficiente de variação. CV = ∙ 100 s x Onde: CV = coeficiente de variação s = desvio padrão amostral x = média amostral Medidas de dispersão e variabilidade6 De acordo com as 4 notas das avaliações realizadas no semestre (7; 8; 6; 9), já calculamos a média x = 7,5 e s = 1,29. O cálculo do coeficiente de variação seria: CV = s x · 100 = 1,29 7,5 · 100 = 17,2% Também podemos calcular o coeficiente de variação para os dados da tabela 1, que já calculamos previamente a média x = 8,2 e s = 0,9965. CV = s x · 100 = 0,9965 8,2 · 100 = 12,15% Utilizando o coeficiente de variação, sempre que quisermos descobrir qual grupo de dados é mais homogêneo, ou seja, o que possui a menor variabilidade em torno da média, devemos optar pelo grupo de dados que tiver o menor percentual do coeficiente de variação. Caso o coeficiente de variação seja muito elevado, a média não será a melhor medida para representarmos os dados devido à alta variabilidade em torno dela. Amplitude interquartílica Essa medida é útil quando temos uma distribuição assimétrica. Os quartis são valores que dividem uma amostra de dados ordenados em quatro partes. As quatro partes são iguais a 25%. No primeiro quartil, denominado de Q1, temos 25% dos valores menores ou iguais a ele. No segundo quartil, deno- minado mediana, temos 50% dos valores menores ou iguais a ele. No terceiro quartil, denominado de Q3, temos 75% dos valores menores ou iguais a ele. A amplitude ou desvio interquartílico é dada pela diferença entre o primeiro e o terceiro quartil (Q1 – Q3). 7Medidas de dispersão e variabilidade
Compartilhar