Baixe o app para aproveitar ainda mais
Prévia do material em texto
BIOESTATÍSTICA MEDIDAS DESCRITIVAS: Medidas de dispersão ou variabilidade Prof. Dr. Eduardo Rodrigues SÃO LUIS 2022 BIOESTATÍSTICA 1 INTRODUÇÃO OBSERVE A SITUAÇÃO SEGUINTE: Notas de três alunos obtidas em cinco provas: Aluno A: 50, 50, 50, 50 e 50 Aluno B: 45, 20, 75, 70 e 40 Aluno C: 75, 0, 15, 100 e 60 Analisando as três situações, percebemos, claramente, que, somente a média (ou mesmo a mediana, ou a moda), é insuficiente para nos dizer algo a respeito das variações observadas em cada situação! Precisamos então, de uma nova medida que possa avaliar essas diferenças: trata-se das medidas de dispersão ou variabilidade, que dentre elas destacam-se: amplitude total, intervalo semi-interquartil, desvio-médio e desvio-padrão. PARA A SITUAÇÃO APRESNETADA, A MÉDIA ARTIMETICA SERIA UMA MEDIDA EFICIENTE? INTRODUÇÃO 3 MEDIDAS DE DISPERSÃO PARA UMA AMOSTRA As medidas de tendência central resumem a informação contida em um conjunto de dados, mas não contam toda a história. Por exemplo, observa-se, diariamente, que, na mesma cidade, a temperatura varia ao longo do dia. Então, a temperatura média do dia não dá toda a informação. O peso das pessoas varia ao longo da vida e a quantidade de dinheiro que carregam nos bolsos varia em função das circunstâncias. Por causa da variabilidade, a média, a mediana e a moda que estudamos anteriormente não são suficientes para descrever um conjunto de dados: informam apenas a tendência central, ou seja, onde está o centro, mas nada dizem sobre a variabilidade. As medidas de tendência central são tanto mais descritivas de um conjunto de dados quanto menor é a variabilidade. Então, quando você apresentar um conjunto de dados, deve fornecer não apenas medidas de tendência central, mas também uma medida de variabilidade ou dispersão. AMPLITUDE DESVIO MÉDIO DESVIO PADRÃO VARIÂNCIA COEFICIENTE DE VARIAÇÃO AMPLITUDE TOTAL 4 MÍNIMO, MÁXIMO E AMPLITUDE Mínimo de um conjunto de dados é o número de menor valor. Máximo de um conjunto de dados é o número de maior valor. A amplitude de um conjunto de dados, definida como a diferença entre o máximo e o mínimo, é uma medida de dispersão ou variabilidade. Um professor fez uma pesquisa de idades em uma turma do ensino médio, composta por “n” alunos, e obteve os seguintes resultados: 15, 15, 15, 15, 16, 16, 16, 14, 16, 16, 16, 17, 17, 18, 18, 18, 18. Qual é a amplitude das idades dos alunos dessa sala de aula? A amplitude de variação é uma ideia básica em Estatística, mas um valor discrepante – por ser muito grande ou muito pequeno – aumenta muito a amplitude. Como dizem os estatísticos, a amplitude é muito sensível aos valores discrepantes. AMPLITUDE TOTAL 5 MÍNIMO, MÁXIMO E AMPLITUDE Um professor fez uma pesquisa de idades em uma turma do ensino médio, composta por “n” alunos, e obteve os seguintes resultados: 15, 15, 15, 15, 16, 16, 16, 14, 16, 16, 16, 17, 17, 18, 18, 18, 18. Qual é a amplitude das idades dos alunos dessa sala de aula? DESVIO-MÉDIO PARA DADOS NÃO-TABULADOS 6 O QUE É UM DESVIO ? CEUMA CIDADE OPERARIA MAIOBÃO PRAIA/ BAR CASA Desvio Desvio DESVIO-MÉDIO PARA DADOS NÃO-TABULADOS 7 O QUE É UM DESVIO ? É a média aritmética (simples) dos DESVIOS ABSOLUTOS das medidas (d) em relação à média aritmética (M) dessas medidas (x), isto é, Onde: = (sigma maiúscula) símbolo do somatório () x = medida d = desvios ou afastamentos das medidas (x) em relação à média aritmética , isto é, n = Número total de dados Desvios = diferença entre o dado amostral e a média aritméticas destes dados. D = M = d = x - M DESVIO-MÉDIO PARA DADOS NÃO-TABULADOS 8 COMO CALCULAR UM DESVIO ? D = (2º) IdI = x - M 1º Passo: Determinar a média aritmética simples 2º Passo: Calcular a diferença entre os dados brutos e a média 3º Passo: Colocar os valores negativos em modulo (os valores ficam todos positivos) 4º Passo: Somar todos os valores após os cálculos do 2º e 3º Passos 5º Passo: Aplicar a formula do Desvio Médio DESVIO-PADRÃO PARA DADOS NÃO-TABULADOS 9 O DESVIO-PADRÃO é uma medida de variabilidade muito recomendada porque mede bem a dispersão dos dados e possibilita, assim, interpretação de interesse prático. O desvio padrão expressa o grau de dispersão de um conjunto de dados. Ou seja, indica o quanto um conjunto de dados é uniforme. Quanto mais próximo de 0 for o desvio padrão, mais homogêneo são os dados. Considere o exemplo de duas linha de produção de uma peça. A medida média do comprimento da peça é de 75cm e ambas as linhas estão produzindo peças com médias próximas desse valor. Podemos considerar que as peças produzidas por ambas as linhas são adequadas? DESVIO-PADRÃO PARA DADOS NÃO-TABULADOS 10 É a média quadrática dos desvios das medidas em relação à media aritmética. Intuitivamente, o desvio-padrão mede a variação entre valores, ou seja, mede a variabilidade da distribuição em relação à média. O desvio-padrão resolve o problema dos sinais dos desvios apresentados pelo desvio-médio, pois eleva ao quadrado cada um desses desvios, eliminando, então, o inconveniente dos sinais negativos. O desvio padrão é uma medida estatística capaz de indicar se os dados parciais que compõem a média final estão próximas ou afastadas em relação a essa média. O desvio-padrão é a medida de dispersão mais utilizada em Estatística, pois incida, de forma mais precisa, o grau de dispersão dos dados em torno da média. Desvio padrão populacional: ou (são equivalentes) σ (é a letra grega sigma minúscula) = símbolo do desvio-padrão populacional DESVIO-PADRÃO PARA DADOS NÃO-TABULADOS 11 DESVIO-PADRÃO DESVIO-PADRÃO PARA DADOS NÃO-TABULADOS 12 O desvio-padrão nunca pode ser um n° negativo, graças ao modo como é calculado e pelo fato de que ele mede uma distância (distâncias nunca são n° negativos) O menor valor possível para o desvio-padrão é O, e isso acontece somente em situações planejadas, em que cada n° do conjunto de dados é igual (sem desvios) O desvio-padrão é influenciado por valores atípicos (n° extremamente baixos ou altos dentro de um conjunto de dados). Isso porque os desvio-padrão baseia-se na distancia dos dados com relação à media. E lembre-se: a média também é afetada por esses valores. O desvio-padrão tem a mesma unidade dos dados originais. PROPRIEDADES DO DESVIO-PADRÃO EXEMPLO DE DP MÉDIO E DP AMOSTRAL 13 Uma amostra de 6 funcionários de uma empresa, aleatoriamente escolhidos, apresentou as seguintes idades, em anos: 29, 28, 39, 56, 44 e 53. Determinar: a media aritmética; o desvio-médio; interpretação do resultado da questão B; desvio padrão amostral; M= M= M= 41,5 anos EXEMPLO DE DP MÉDIO E DP AMOSTRAL 14 Uma amostra de 6 funcionários de uma empresa, aleatoriamente escolhidos, apresentou as seguintes idades, em anos: 29, 28, 39, 56, 44 e 53. Resposta (C) Interpretação: Espera-se que, em media, haja uma variação de 9,5 anos, para mais ou para menos, das idades desses funcionários em relação à média das idades dos mesmos; Resposta (C) Interpretação: Um desvio padrão pequeno, basicamente significa que os valores do conjunto de dados estão, na media, próximos ao centro desses conjunto. Enquanto que um desvio-padrão grande significa o oposto. Os valores estão mais afastados do centro. B) O DESVIO-MÉDIO C) COMO INTERPRETAR? D = D = D = 9,5 EXEMPLO DE DP MÉDIO E DP AMOSTRAL 15 Uma amostra de 6 funcionários de uma empresa, aleatoriamente escolhidos, apresentou as seguintes idades, em anos: 29, 28, 39, 56, 44 e 53. D) DESVIO PADRÃO AMOSTRAL VARIÂNCIA 16 A variância das medidas x é o quadrado do desvio-padrão dessas mediadas. Assim, a variância populacional é: Var = σ², e o desvio-padrão populacional é a raiz quadrada da variância populacional, ou seja, σ = . Analogamente, a variância amostral é Var = s², e o desvio-padrão amostral é: s= . A variância tem grande aplicação quando estudamos as dispersões de duas distribuições, pois o desvio-padrão(que utiliza a raiz quadrada) não tem a propriedade aditiva, pois a soma de raízes quadradas não é a raiz quadrada da soma. COEFICIENTE DE VARIAÇÃO DE PEARSON 17 Trata-se de uma medida relativa de dispersão, a qual é utilizada para fazermos comparações das dispersões das distribuições e que relaciona o desvio-padrão com a média aritmética (isto é, o coeficiente de variações representa a porcentagem que é o desvio padrão da media aritmética). O coeficiente de variação amostral é dado por: Regra empírica para interpretação do coeficiente de variação: Se < 15% há baixa dispersão Se 15% ≤ ≤ 30% há média dispersão Se > 30% há elevada dispersão = x 100 Xd = x - MIdI 2929 - 41,5 = - 12,512,5 2828 - 41,5 = - 13,513,5 3939 - 41,5 = - 2,52,5 5656 - 41,5 = + 14,514,5 4444 - 41,5 = + 2,52,5 5353 - 41,5 = + 11,511,5 24957 Xd d² 29-12,5156,25 28-13,5182,25 39-2,56,25 5614,5210,25 442,56,25 5311,5132,25 ∑2490693,5
Compartilhar