Prévia do material em texto
1 A média é extremamente útil como uma medida que objetiva representar/ resumir um conjunto de dados, mas também é imprescindível ao pesquisador ter conhecimento da variação que ocorre em torno desta média. Para isso o cálculo das medidas de variabilidade contribui para uma melhor interpretação do comportamento de uma variável quantitativa (sua média e sua variação). Tão importante quanto representarmos todos os valores de um conjunto de dados através das medidas de tendência central é ter o conhecimento da variação que ocorre em torno desta medida. As medidas de variabilidade são extremamente úteis no tratamento de dados, pois estas indicam a variação existente em torno da média. As medidas de variabilidade que veremos em nossa disciplina são: Variância, Desvio-padrão e Coeficiente de variação VARIÂNCIA A variância de uma amostra corresponde à média dos quadrados dos desvios dos valores em relação à média, Quanto maior for a variação dos valores do conjunto de dados, maior será a variância. Notação: 2 - variância populacional s2 - variância amostral 2 Fórmula: 𝑠2 = ∑(𝑥− �̅�)2 𝑛−1 EXEMPLO 1: Os dados apresentados abaixo correspondem ao número de reclamações (em mil reclamações) diárias recebidas pelo PROCON referentes as operadoras de TV a cabo no período de 5 dias: 17 18 16 20 22 Elementos importantes Variável (x): número de reclamações (em mil reclamações) diárias recebidas pelo PROCON referentes as operadoras de TV a cabo Amostra (n): 7 dias Onde: x – valores da variável investigada �̅� - média da amostra n – tamanho da amostra Σ - somatório 3 Média: �̅� = ∑ 𝑥 𝑛 = 17 + 18 + 16 + 20 + 22 5 = 93 5 = 18,6 �̅� = 18,6 reclamações/dia Variância: 𝑠2 = ∑(𝑥 − �̅�)2 𝑛 − 1 𝑠2 = (17 − 18,6)2 + (18 − 18,6)2 + (16 − 18,6)2 + (20 − 18,6)2 + (22 − 18,6)2 5 − 1 𝑠2 = 2,56 + 0,36 + 6,76 + 1,96 + 11,56 4 = 23,2 4 = 5,8 𝑠2 = 5,8 reclamações/dia2 DESVIO-PADRÃO O desvio-padrão é a raiz quadrada da variância. Esta medida expressa a variação média do conjunto de dados em torno da média, para mais ou para menos, pode ser calculado considerando as seguintes etapas: 1ª) Calcular a média 2ª) Subtrair a média de cada valor do conjunto (desvio) 3ª) Elevar ao quadrado cada desvio 4ª) Somar os quadrados dos desvios 5ª) Dividir esta soma por (n-1) 6ª) Tirar a raiz quadrada 4 Notação: - desvio-padrão populacional s - desvio-padrão amostral Fórmula: 𝑠 = √∑(𝑥−�̅�)2 𝑛−1 Para o exemplo apresentado teremos: Desvio-padrão: 𝑠 = √𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 = √5,8 = 2,4 𝑠 = 2,4 reclamações/dia Interpretação: Em média, o PROCON recebe diariamente 18,6 reclamações com uma variação em torno desta média de 2,4 reclamações. EXEMPLO 2: Os dados apresentados a seguir referem-se ao número de partos normais realizados em um hospital particular em uma amostra de 8 meses Jan Fev Mar Abr Mai Jun Jul Ago 200 210 200 210 210 250 230 210 Amostra (n): 8 meses Variável (x): Número de partos normais 5 Média �̅� = ∑ 𝑥 𝑛 = 200 + 210 + 200 + 210 + 210 + 250 + 230 + 210 8 = 1720 8 = 215 �̅� = 215 𝑝𝑎𝑟𝑡𝑜𝑠 Variância 𝑠2 = ∑ (𝑥 − �̅�)2 𝑛 − 1 (200 − 215)2 × 2 + (210 − 215)2 × 4 + (250 − 215)2 + (230 − 215)2 8 − 1 450 + 100 + 1225 + 225 7 = 285,7 𝑠2 = 285,7 Desvio-Padrão 𝑠 = √∑ (𝑥 − �̅�)2 𝑛 − 1 = √285,7 = 16,9 𝑝𝑎𝑟𝑡𝑜𝑠 Interpretação: “Em média são realizados 215 partos normais com uma variação (desvio-padrão) de 16,9 partos”. [215 ± 16,9 partos] 6 COEFICIENTE DE VARIAÇÃO Quando desejamos comparar a variabilidade entre métodos, ou ainda entre grupos de valores é indicada a utilização do Coeficiente de Variação que representa o desvio-padrão expresso como uma porcentagem da média. Notação: C.V. - Coeficiente de variação Fórmula: 𝐶. 𝑉. = 𝑠 �̅� × 100 Para o exemplo... 𝐶. 𝑉. = 𝑠 �̅� × 100 = 2,4 18,6 × 100 = 12,9% 𝐶. 𝑉. = 12,9% Interpretação: Existe uma variação em torno da média de 12,9%. Onde: �̅� - média da amostra s – desvio-padrão 7 MEDIDAS DE VARIABILIDADE PARA DADOS AGRUPADOS EM TABELAS DE FREQUENCIA EXEMPLO 1: Os dados abaixo referem-se ao tempo de espera na fila de um caixa de supermercado (em minutos): Tempo de espera na fila (minutos) Tempo de espera (x) Frequência (f) % x.f 0 5 8,0 0 x 5 = 0 2 25 40,3 2 x 25= 50 4 30 48,4 4 x 30= 120 6 2 3,2 6 x 2= 12 Total 62 (n) 100 182 Média: �̅� = ∑ 𝑥 . 𝑓 𝑛 = 0 + 50 + 120 + 12 62 �̅� = ∑ 𝑥 . 𝑓 𝑛 = 182 62 = 2,9 minutos Agora vamos calcular a variância e o desvio-padrão. Neste caso devemos considerar a frequência de cada valor da variável. Variância: 𝑠2 = ∑(𝑥 − �̅�)2. 𝑓 𝑛 − 1 8 Tempo de espera na fila (minutos) Tempo de espera (x) Frequência (f) % (𝑥 − �̅�)2. 𝑓 0 5 8,0 (0 – 2,9)2. 5 = 42,05 2 25 40,3 (2 – 2,9)2. 25 = 20,25 4 30 48,4 (4 – 2,9)2. 30 = 36,3 6 2 3,2 (6 – 2,9)2. 2 = 19,22 Total 62 (n) 100 117,82 𝑠2 = ∑(𝑥 − �̅�)2. 𝑓 𝑛 − 1 = 42,05 + 20,25 + 36,3 + 19,22 62 − 1 = 117,82 61 = 1,93 𝑠2 = 1,93 minutos2 Desvio-padrão: 𝑠 = √∑(𝑥 − �̅�)2 𝑛 − 1 = √1,93 = 1,4 s = 1,4 minutos Interpretação: “Em média o tempo de espera na fila deste supermercado é de 2,9 minutos com uma variação em torno desta média de 1,4 minutos”. 9 EXEMPLO 2: Considere a seguinte tabela anteriormente citado referente ao Número de casos registrados de febre amarela em uma amostra de 62 cidades: Número de casos de febre amarela Nº casos (x) Frequência (f) % x.f 0 5 8,0 0 x 5 = 0 2 25 40,3 2 x 25= 50 4 30 48,4 4 x 30= 120 6 2 3,2 6 x 2= 12 Total 62 (n) 100 182 Para este exemplo já havíamos calculado a média: �̅� = ∑ 𝑥 . 𝑓 𝑛 = 0 + 50 + 120 + 12 62 �̅� = ∑ 𝑥 . 𝑓 𝑛 = 182 62 = 2,9 casos Agora vamos calcular a variância e o desvio-padrão. Neste caso devemos considerar a frequência de cada valor da variável. Variância 𝑠2 = ∑ (𝑥 − �̅�)2. 𝑓 𝑛 − 1 10 Número de casos de febre amarela Nº casos (x) Frequência (f) % (𝑥 − �̅�)2. 𝑓 0 5 8,0 (0 – 2,9)2. 5 = 42,05 2 25 40,3 (2 – 2,9)2. 25 = 20,25 4 30 48,4 (4 – 2,9)2. 30 = 36,3 6 2 3,2 (6 – 2,9)2. 2 = 19,22 Total 62 (n) 100 117,82 𝑠2 = ∑ (𝑥 − �̅�)2. 𝑓 𝑛 − 1 = 42,05 + 20,25 + 36,3 + 19,22 62 − 1 = 117,82 61 = 1,93 Desvio-padrão 𝑠 = √∑ (𝑥 − �̅�)2. f 𝑛 − 1 = √1,93 = 1,4 s = 1,4 casos Interpretação: “Em média ocorreram 2,9 casos de febre amarela em cada cidade com uma variação de 1,4 casos”. [2,9 ± 1,4 casos]