Baixe o app para aproveitar ainda mais
Prévia do material em texto
BIOESTATÍSTICA Profa. Fabrícia Salvador ESTATÍSTICA DESCRITIVA Medidas de Tendência Central e Dispersão Aula 04 Estatística Descritiva Medidas de Tendência Central Média Mediana Moda Medidas de Dispersão Amplitude Total Variância Desvio Padrão Coeficiente de Variação Medidas de Tendência Central MÉDIA MEDIANA MODA Estão associadas à homogeneidade dos dados Dados não agrupados São os dados ou observações que estão organizados em dados ainda brutos, ou até mesmos em Rol Ex.: Estudo sobre a quantidade de filhos de 7 pacientes internados na UTI coronariana. a) Dados brutos: 3, 7, 1, 5, 3, 6, 6 b) Rol : {1, 3, 3, 5, 6, 6, 7} Dados agrupados São os dados ou observações que estão organizados em tabelas ou gráficos. Ex.: Estudo sobre a quantidade de filhos de 7 pacientes internados na UTI coronariana. Fonte: Dados da própria pesquisa. Tabela1: Quantidade de filhos por pacientes internados na UTI coronariana, Fortaleza-CE, 2018. Ex.: Estudo sobre a quantidade de filhos de 7 pacientes internados na UTI coronariana. a)Dados brutos: 3 - 7 -1 - 3 - 6 - 5 - 6 b)ROL: { 1 - 3 - 3 - 5 - 6 - 6 - 7} c) X : 1+3+3+5+6+6+7 = 31 = 4,4 filhos por paciente 7 7 Resposta: Em média os pacientes têm 4,4 filhos. X = 4,4 filhos Média - X Média - X Ex.: Calcule a média aritmética dos pesos de 12 pacientes participantes de uma pesquisa sobre obesidade e distúrbios alimentares. Dados brutos: 50 - 62 - 70 - 86 - 60 - 64 - 66 - 77 - 58 - 55 - 82 – 74 ROL: {50 - 55 - 58 - 60 - 62 - 64 - 66 - 70 - 74 - 77 - 82 - 86} c) Média: 50+55+58+60+62+64+66+70+74+77+82+86 = 804 = 67kg 12 12 Resposta: Em média os pacientes pesam aproximadamente 67kg. X = 67kg Vamos supor que um aluno obteve as seguintes notas durante os 4 bimestres do ano: 1° bimestre: 9,0 2° bimestre: 8,5 3° bimestre: 7,0 4° bimestre: 6,0 Vamos supor, então, que cada bimestre tenha um peso diferente na nota final, ou total, mantendo os seguintes pesos: 1° bimestre: peso 1 2° bimestre: peso 2 3° bimestre: peso 3 4° bimestre: peso 4 Vamos aplicar o conceito de média aritmética ponderada para descobrir a média anual desse aluno: 9 x 1 = 9 8,5 x 2 = 17 7 x 3 = 21 6 x 4 = 24 P = 9 + 17 + 21 + 24 = 71 = 7,1 pontos 1 + 2 + 3 + 4 10 Média Aritmética Ponderada - P Se a amostra é constituída por um número ÍMPAR de dados, a mediana é o valor que fica no centro dos dados. Mediana - Md Se a amostra é constituída por um número ÍMPAR de dados, a mediana é o valor que fica no centro dos dados. Mediana - Md Ex.: Estudo sobre a quantidade de filhos de 7 pacientes internados na UTI coronariana. a)Dados brutos: 3 - 7 -1 - 3 - 6 - 5 - 6 b)ROL: { 1 - 3 - 3 - 5 - 6 - 6 - 7} Mediana - Md Resposta: 50% dos meus pacientes têm menos de 5 filhos ou 50% dos meus pacientes têm mais de 5 filhos Md = 5 filhos Se a amostra é constituída por um número PAR de dados, a Md será a média aritmética dos dois valores que ficam na posição central dos dados ordenados. Mediana - Md Mediana - Md Resposta: 50% dos 12 pacientes pesam menos de 65kg ou 50% pesam mais de 65kg. Md = 65kg Ex.: Calcule a mediana dos pesos de 12 pacientes participantes de uma pesquisa sobre obesidade e distúrbios alimentares. Dados brutos: 50 - 62 - 70 - 86 - 60 - 64 - 66 - 77 - 58 - 55 - 82 – 74 ROL: {50 - 55 - 58 - 60 - 62 - 64 - 66 - 70 - 74 - 77 - 82 - 86} c) Md: 64 + 66 = 65kg 2 Mediana - Md Resposta: 50% dos 8 pacientes usam menos de 5,5 medicamentos ou 50% dos 8 pacientes tomam mais de 5,5 medicamentos. Md = 5,5 medicamentos Ex.: Calcule a mediana da quantidade de medicamentos tomados pelos 8 pacientes da enfermaria oncológica. Dados brutos: 6 - 3 - 7 - 1 - 3 - 6 - 5 - 6 ROL: { 1 - 3 - 3 - 5 - 6 - 6 - 6 - 7 } c) Md: 5 + 6 = 5,5 medicamentos 2 Como saber se é melhor usar a Média ou a Mediana para representar os dados de uma variável? Como saber se é melhor usar a Média ou a Mediana para representar os dados de uma variável? A Média sempre será influenciada por valores extremos dos dados de uma variável! Ex.: Estudo sobre obesidade. Variável em estudo = PESO ROL: { 2 - 5 - 7 - 19 - 53 - 70 - 82 - 250 } Md ? Como saber se é melhor usar a Média ou a Mediana para representar os dados de uma variável? A Média sempre será influenciada por valores extremos dos dados de uma variável! Ex.: Estudo sobre obesidade. Variável em estudo = PESO ROL: { 2 - 5 - 7 - 19 - 53 - 70 - 82 - 250 } c) Md: 19 + 53 = 36kg 2 Como saber se é melhor usar a Média ou a Mediana para representar os dados de uma variável? A Média sempre será influenciada por valores extremos dos dados de uma variável! Ex.: Estudo sobre obesidade. Variável em estudo = PESO ROL: { 2 - 5 - 7 - 19 - 53 - 70 - 82 - 250 } Como saber se é melhor usar a Média ou a Mediana para representar os dados de uma variável? A Média sempre será influenciada por valores extremos dos dados de uma variável! Md Ex.: Estudo sobre obesidade. Variável em estudo = PESO ROL: { 2 - 5 - 7 - 19 - 53 - 70 - 82 - 250 } X = ? X= 2+5+7+19+53+70+80+250 = 488 = 61kg Como saber se é melhor usar a Média ou a Mediana para representar os dados de uma variável? A Média sempre será influenciada por valores extremos dos dados de uma variável! Md 8 Ex.: Estudo sobre obesidade. Variável em estudo = PESO ROL: { 02 - 05 - 07 - 19 - 53 - 70 - 82 - 250 } X = ? X= 2+5+7+19+53+70+80+250 = 488 = 61kg Como saber se é melhor usar a Média ou a Mediana para representar os dados de uma variável? A Média sempre será influenciada por valores extremos dos dados de uma variável! Md 8 x É o valor que ocorre com maior frequência em um ROL de dados. Moda - Mo Moda - Mo Resposta: 6 é a quantidade de medicamentos em uso mais frequente entre os pacientes da enfermaria oncológica. Ex.: Calcule a moda da quantidade de medicamentos tomados pelos 8 pacientes da enfermaria oncológica. Dados brutos: 6 - 3 - 7 - 1 - 3 - 6 - 5 - 6 ROL: { 1 - 3 - 3 - 5 - 6 - 6 - 6 - 7 } c) Mo = 6 medicamentos Moda - Mo Classificação da Moda: Modal ou unimodal Bimodal Multimodal Amodal Medidas de Dispersão As medidas de dispersão estão associadas à heterogeneidade dos dados AMPLITUDE TOTAL (AT) DESVIO PADRÃO (S) VARIÂNCIA (S2) COEFICIENTE DE VARIAÇÃO (CV) Amplitude Total - AT É a diferença entre o MAIOR e o MENOR valor do Rol de dados Serve para analisar o grau de dispersão dos dados em torno da média Quanto maior a AT, maior o grau de dispersão dos dados em torno da média Quanto menor a AT, menor é o grau de dispersão dos dados em torno da média DESVANTAGEM: é uma medida de dispersão limitada, pois só leva em conta os valores extremos do Rol de dados, ou seja, não é afetada por valores internos do Rol de dados Amplitude Total - AT Notas de Ana: {12, 13, 13, 14} AT: 14-12 = 2 PONTOS AT DE JOÃO FOI DE 10 PONTOS AT DE ANA FOI DE 2 PONTOS Notas de Ana: {12, 13, 13, 14} AT: 14-12 = 2 PONTOS AT DE JOÃO FOI DE 10 PONTOS AT DE ANA FOI DE 2 PONTOS O grau de dispersão das notas de João é maior que o de Ana Para entender o que é dispersão, imagine que 4 alunos obtiveram, em 5 provas, as notas apresentadas na tabela abaixo: Tabela 1: Notas de quatro alunos em cinco provas. Dispersão Antônio: 5 – 5 = 0 dispersão, ou variação, ou amplitude é nula João: 6 – 4 = 2 dispersão, variação ou amplitude é de 2 pontos José: 10 - 0 = 10 dispersão, variação ou amplitude é de 10 pontos Pedro: 10 - 0 = 10 dispersão, variação ou amplitude é de 10 pontos Mas a notas de Pedro variaram mais que as notas de José! Dispersão Antônio: 5 – 5 = 0 dispersão, ou variação, ou amplitude é nula João: 6 – 4 = 2 dispersão, variação ou amplitude é de 2 pontos José: 10 - 0 = 10 dispersão, variação ou amplitude é de 10 pontos Pedro: 10 - 0 = 10 dispersão, variação ou amplitude é de 10 pontos Mas a notas de Pedro variaram mais que as notas de José! DispersãoAntônio: 5 – 5 = 0 dispersão, ou variação, ou amplitude é nula João: 6 – 4 = 2 dispersão, variação ou amplitude é de 2 pontos José: 10 - 0 = 10 dispersão, variação ou amplitude é de 10 pontos Pedro: 10 - 0 = 10 dispersão, variação ou amplitude é de 10 pontos Mas a notas de Pedro variaram mais que as notas de José! A AMPLITUDE NÃO MEDE BEM A DISPERSÃO DOS DADOS PORQUE, EM SEU CÁLCULO, USA-SE APENAS OS DADOS EXTREMOS E NÃO TODOS OS DADOS! Variância Amostral – S2 Ela mede a variabilidade do Rol de dados em termos de desvios quadrados em relação a média aritmética É um valor sempre POSITIVO Mede a variação de todos os dados em relação a média Variância Amostral – S2 Considere que um grupo de alunos tenha tirado as seguintes notas em Biossegurança: ROL: 2, 3, 3, 4, 5, 6, 7, 8, 9, 10 X = 2+3+3+4+5+6+7+8+9+10 = 5,7 pontos 10 Variância Amostral – S2 Considere que um grupo de alunos tenha tirado as seguintes notas em Biossegurança: ROL: 2, 3, 3, 4, 5, 6, 7, 8, 9, 10 X = 2+3+3+4+5+6+7+8+9+10 = 5,7 pontos 10 Variância Amostral – S2 Considere que um grupo de alunos tenha tirado as seguintes notas em Biossegurança: ROL: 2, 3, 3, 4, 5, 6, 7, 8, 9, 10 X = 2+3+3+4+5+6+7+8+9+10 = 5,7 pontos 10 1º passo: Encontrar a média Variância Amostral – S2 Rol: 2, 3, 3, 4, 5, 6, 7, 8, 9, 10 2º passo: Encontrar os desvios em relação a média 5,7 Agora, calculamos os desvios de todas essas notas em relação à média: Se calcularmos a média desses desvios, somando-os e dividindo o resultado por 10, ela será nula, pois a soma de todos esses desvios será zero, pelo próprio significado da média como medida de tendência central Assim, elevamos ao quadrado esses desvios e, aí calculamos a média dos resultados. É a VARIÂNCIA. S2 = 13,69+7,29+2,89+0,49+0,09+1,69+5,29+10,89+18,49 = 6,756... 10 - 1 Variância Amostral – S2 Resposta: A Variância nas notas de Biossegurança foi de 6,7566... pontos Variância Populacional Variância Amostral S2 = 13,69+7,29+2,89+0,49+0,09+1,69+5,29+10,89+18,49 = 6,756... 10 - 1 Variância Amostral – S2 Resposta: A Variância nas notas de Biossegurança foi de 6,7566... pontos Variância Populacional Variância Amostral 3º passo: Encontrar a 2º média Podemos concluir que a dispersão das notas em relação à média é de 6,81 No entanto, a variância não está na mesma unidade que as nossas notas, pois os desvios foram elevados ao quadrado Para conservarmos as unidades do desvio e dos dados, calculamos o desvio-padrão, o qual nada mais é do que extrair a raiz quadrada da variância. Resposta: O desvio padrão das notas de Biossegurança em relação à média é de 2,60 pontos. É uma outra medida de dispersão mais comumente utilizada que a Variância, pois está na mesma unidade de medida que os demais dados do Rol Mede a dispersão absoluta dos dados É obtida a partir da Variância Ele indica a variação média dos dados em torno da média Desvio Padrão – S É uma outra medida de dispersão mais comumente utilizada que a Variância, pois está na mesma unidade de medida que os demais dados do Rol Mede a dispersão absoluta dos dados É obtida a partir da Variância Ele indica a variação média dos dados em torno da média Desvio Padrão – S Comumente o Desvio Padrão é apresentado junto da Média Aritmética do Rol de dados da seguinte forma: (X ± S) Desvio Padrão – S Desvio Padrão – S Coeficiente de Variação - CV É a razão entre o desvio-padrão e a média O coeficiente de variação é apresentado na forma de percentual (%), pois indica a variação relativa no conjunto de dados em relação à média Quanto menor o CV, mais homogêneos serão os dados em relação à média É uma medida de variabilidade relativa Útil para comparar variabilidade de observações com unidades de medidas diferentes Coeficiente de Variação - CV Coeficiente de Variação - CV 5,7 2,60 X 100 = Coeficiente de Variação - CV 5,7 2,60 = Coeficiente de Variação - CV 5,7 2,60 X 100 = 45,6% = Coeficiente de Variação - CV 5,7 2,60 X 100 = 45,6% = Vamos calcular o CV e identificar o grau de dispersão? CV= 13,48% CV= 14,50% CV= 14,29% PODEMOS CONFIAR NA MÉDIA? CV= 13,48% CV= 14,50% CV= 14,29% Vamos praticar? Exercício Proposto Um estudo sobre a estatura média da altura dos alunos da UNINASSAU encontrou os seguintes dados: Calcule: a) A média aritmética: b) A mediana: c) A moda e a sua classificação: d) Valor máximo: e) Valor mínimo: f) Amplitude total: g) Variância: h) Desvio padrão: i) Coeficiente de variação: A média aritmética: 1639 = 1,49 metros b) A mediana: 1,52 metros c) Valor Máximo: 1,70 metros d) Valor Mínino: 1,35 metros e) Amplitude total: 1,70-1,35 = 35 cm Exercício Proposto 11 f) Variância: f) S2 = 1.314 = 131,4 11-1 e) Desvio Padrão: S = 131,4 = 11,4629...cm g) CV = 11,4629 149 X 100 = 7,69327% AcabouUuU!! Até a próxima aula!! N° DE FILHOS N 1 1 3 2 6 2 7 1
Compartilhar