Prévia do material em texto
MEDIDAS DE DISPERSÃO PARA UMA AMOSTRA Prof. Dr. Marcus Rodrigues da Costa Se a natureza fosse estável, se as mesmas causas produzissem sempre os mesmos efeitos, é bem possível que o homem nunca tivesse desenvolvido a noção de variação, mas a realidade é outra: o mundo está em permanente oscilação. Ao conjunto das medidas, que medem as oscilações de uma variável deu-se o nome de medidas de variabilidade. Existem várias medidas de variabilidade, ou parâmetros de dispersão de uma distribuição de dados. Notas de quatro alunos em cinco provas. Alunos Notas Média João 5 5 5 5 5 5 Paulo 6 4 5 4 6 5 José 10 5 5 5 0 5 Maria 10 10 5 0 0 5 JOÃO – DISPERSÃO NULA (NOTAS NÃO VARIAM) PAULO – NOTAS VARIAM MENOS QUE AS NOTAS DE JOSÉ JOSÉ – VARIAM MENOS QUE AS NOTAS DE MARIA MARIA – SUAS NOTAS VARIAM MAIS DO QUE TODOS OS OUTROS ALUNOS TODAS ESTAS OBSERVAÇÕES SERÃO VERIFICADAS ATRAVÉS DAS SEGUINTES MEDIDAS DE DISPERSÃO: AMPLITUDE, VARIÂNCIA E DESVIO PADRÃO AMPLITUDE É UMA MEDIDA DE DISPERSÃO DOS DADOS, MAS É NÃO MUITO BOA PQ USA OS EXTREMOS DE UM CONJUNTO DE DADOS. AMPLITUDE: É A DIFERENÇA ENTRE O MAIOR E O MENOR DADO OBSERVADO. AMPLITUDE NEM SEMPRE CAPTA DIFERENÇAS. JOÃO: a = 5 – 5 = 0 PAULO: a = 6 – 4 = 2 JOSÉ: a=10 – 0 = 10 MARIA: a=10 – 0 = 10 ONDE ESTÁ O ERRO? VEJA QUE ESTA ANÁLISE NÃO MOSTRA QUE AS NOTAS DE MARIA VARIAM MAIS QUE AS DE JOSÉ. Então hipoteticamente o lagoa A teria uma distribuição mais homogenia LAGO A a = 13 – 6 = 7 LAGO B a = 18 – 3 = 15 PERGUNTA: EM QUAL DOS DOIS LAGOS A DISTRIBUIÇÃO DOS PEIXES É MAIS REGULAR (HOMOGÊNEA)? VARIÂNCIA S2 ou PARA MEDIR A DISPERSÃO DOS DADOS EM TORNO DA MÉDIA USA-SE, ENTÃO, A VARIÂNCIA, QUE LEVA EM CONSIDERAÇÃO O TAMANHO DA AMOSTRA. A VARIÂNCIA PODE SER DA AMOSTRA, MENOS 1 (n – 1). OS ESTATÍSTICOS CHAMAM O VALOR (n – 1) de graus de liberdade. PORTANTO, A VARIÂNCIA É CALCULADA SEGUNDO A FÓRMULA ACIMA. ENTÃO: Respondendo a pergunta: Qual dos dois lagos tem uma distribuição mais regular? RESPOSTA: O lago A, porque tem menor variância que o lago B, ou seja, o lago A é mais HOMEGENEO. DESVIO PADRÃO COMO MEDIDA DE DISPERSÃO, A VARIÂNCIA TEM A DESVANTAGEM DE APRESENTAR UNIDADE DE MEDIDA IGUAL AO QUADRADO DA UNIDADE DE MEDIDA DOS DADOS. EX.: se os dados estão em metros, a VARIÂNCIA fica em METROS AO QUADRADO. O DESVIO PADRÃO é uma MEDIDA DE DISPERSÃO que apresenta as propriedades da VARIÂNCIA e tem a mesma unidade dos dados. O DESVIO PADRÃO É DEFINIDO COMO A RAIZ QUADRADA DA VARIÂNCIA, COM SINAL POSITIVO. O DESVIO PADRÃO É REPRESENTADO POR “S”. AlunosS Notas Média Variância João 5 5 5 5 5 5 0 Paulo 6 4 5 4 6 5 1 José 10 5 5 5 0 5 12,5 Maria 10 10 5 0 0 5 25 S = 12,5 = 3,54 COEFICIENTE DE VARIAÇÃO O COEFICIENTE DE VARIAÇÃO É A RAZÃO ENTRE O DESVIO PADRÃO E A MÉDIA. SEU RESULTADO É MULTIPLICADO POR 100, PARA QUE O COEFICIENTE DE VARIAÇÃO SEJA DADO EM PORCENTAGEM CV = S / X * 100 INTERPRETAÇÃO: QUANTO MAIOR O CV, TEMOS UM INDICATIVO QUE A DISPERSÃO DOS DADOS EM RELAÇÃO A MÉDIA É MUITO GRANDE, OU SEJA A DISPERSÃO É ALTA. •Diz-se que a distribuição possui baixa, média ou alta variabilidade (dispersão) conforme os seguintes valores: Baixa dispersão: CV ≤ 10% Média dispersão: 10% < CV < 20% Alta dispersão: CV ≥ 20% • Alguns analistas consideram valores diferentes: Baixa dispersão: CV ≤ 15% Média dispersão: 15% < CV < 30% Alta dispersão: CV ≥ 30% Coeficiente de variação: MEDIDAS DE FORMA Uma distribuição de frequência pode simétrica, assimétrica positiva ou assimétrica negativa. Medidas de assimetria: Denomina-se assimetria o grau de desvio ou afastamento da simetria de uma distribuição. IMPORTANTE! Por convenção, a média, a variância e o desvio padrão de uma série de dados amostras são representados, respectivamente, pelas letras m ou x-barra,v ou s2 e s. Quando se trata da população, esses parâmetros devem ser representados pelas letras gregas μ2, σ2 . Você começou a perceber o que é Estatística e suas aplicações no cotidiano e também na Biologia. Aprendeu a organizar os dados em distribuição de freqüência e a calcular os parâmetros dessa distribuição. Observou que eles se dividem em parâmetros de posição (média, mediana, moda) e de dispersão (variância, desvio padrão). Aprendeu também que a amostra permite estimar os parâmetros de uma população. CALCULE A MÉDIA, VARIÂNCIA, DESVIO PADRÃO E O COEFICIENTE DE VARIAÇÃO DAS NOTAS DOS ALUNOS EXERCÍCIOS Calcule as seguintes medidas de dispersão entre as zonas por turno: amplitude, variância, desvio padrão e coeficiente de variação, dos dados apresentados na tabela abaixo. A partir dos resultados explique quais as diferenças entre as zonas de cada turno. Formule um pequeno texto de no máximo 5 linhas explicando os padrões encontrados. EXERCÍCIOS