Baixe o app para aproveitar ainda mais
Prévia do material em texto
Conceitos básicos e o Estudo da estatística descritiva: organização e apresentação de dados, medidas de tendência central e de variabilidade. Professor Drº Jairo Domingos de Morais Instituto de Ciências da Saúde Curso de Farmácia Disciplina: Bioestatística jairo Nota Saudações caros alunos, daremos início ao conteúdo de Bioestatística - Estatística Descritiva - Nos próximos slides veremos a sua aplicabilidade, conceitos e exemplos. Conceito - Vários • Aurélio - Parte da matemática em que se investigam os processos de obtenção, organização e análise de dados sobre uma população ou sobre uma coleção de seres quaisquer, e os métodos de tirar conclusões e fazer ilações (inferência) ou predições com base nesses dados. jairo Nota Buscando iniciar conceituar a estatística, vamos buscar no seu significado mais simplista que é no dicionário Aurélio. Faça uma comparação com o Jogo da Moeda realizado em sala - foram sucessivos processo de Obtenção de dados (tempo de cada moeda), organização dos dados (colocou no caderno de quem estava anotando) e análise dos dados (formação do gráfico na cartolina que facilitou a análise e interpretação) para então tirar conclusões (Qual a moeda que girou mais rápido?). Tudo o que foi feito no jogo da moeda era estatística pura (de maneira dinâmica e simples). Vamos ver outros conceitos mais adiante. Conceito - Vários • “(...) é a arte de torturar os dados até que eles confessem a verdade”. “25 francos lembram” • “(...) nada mais é do que o bom senso expresso em números”. • “Ciência que utiliza métodos rígidos para lidar com incertezas”. COVID-19 – Aumento de casos • “Ciência que procura estabelecer os limites da incerteza”. • “Ciência que coleta, classifica e avalia numericamente fatos que servirão de base para inferência”. jairo Nota Alguns outros conceitos - 1 - arte de torturar os dados (lembram que nosso colega do grupo Kunsudé falava da moeda de 25 francos era mais rápida e tentou explicar mas os dados e os gráficos mostravam o contrário, a estatística fez confessar a verdade que ela não era a mais rápida). 2 - Bom senso expresso em números - em algumas vezes eles expressam hipóteses testadas que já prevíamos no nosso bom senso, validando-as. 3 - Métodos rígido para lidar com a INCERTEZA - O jornal demonstra que nas próximas semanas os casos de COVID-19 (coronavírus) irá aumentar consideravelmente (mas como saber). Métodos estatísticos demonstram a predição de algo que poderá ocorrer. Lembram da Transição demográfica (Saúde Coletiva), como se saber que em 2050 o número de idosos vai aumentar de tal forma que terão mais idosos que criança e adolescentes - Métodos rígidos de estatísticas para predizer sobre a INCERTEZA. 4 - ciência que coleta, classifica e avalia - Só comparar com o Jogo da moeda e nele lembrem que vocês buscaram fazer inferências sobre o jogo e as moedas. Vamos mais adiante, entender melhor tudo isso. Conceito • “A Estatística é um conjunto de métodos e técnicas que auxiliam a tomada de decisão sob a presença de incerteza”. • Ex: Eleição. jairo Nota Esse é o conceito mais utilizado nos dias atuais. Um exemplo e a eleição. um série de pessoas vão as ruas e realizam uma pesquisa de opinião sobre determinados candidatos em um número X de indivíduos que servirá de base para saber se um candidato Y ou Z está na frente ou não nas eleições e isso serve para que a disputa se torne cada vez mais planejada, analisada e, portanto, tome a decisão correta em determinado pleito político. Já escutou que Candidato X têm 55 % das intenções do votos com 5 pontos percentuais para mais ou para menos, estando na frente. Isso é estatística. Uso da estatística • Na áreas - Científica, social, econômica, educacional, sanitária, hospitalar, agrícola, industrial, militar, geográfica, astronômica, demográfica, eleitoral; pesquisas de mercado, de opinião pública, de tráfego terrestre, aéreo e marítimo, de comunicações, de imagens de satélites, de seguros, de acidentes, etc... jairo Nota Onde você imaginar a estatística está sendo usada, até mesmo no futebol. Em todas essas áreas do slide e outras. Uso da estatística – Dados estatísticos ajudam governo a criar políticas públicas. http://www.youtube.com/watch?feature=pla yer_detailpage&v=J76eKCa5k70 http://www.youtube.com/watch?feature=player_detailpage&v=J76eKCa5k70 http://www.youtube.com/watch?feature=player_detailpage&v=J76eKCa5k70 http://www.youtube.com/watch?feature=player_detailpage&v=J76eKCa5k70 http://www.youtube.com/watch?feature=player_detailpage&v=J76eKCa5k70 http://www.youtube.com/watch?feature=player_detailpage&v=J76eKCa5k70 http://www.youtube.com/watch?feature=player_detailpage&v=J76eKCa5k70 http://www.youtube.com/watch?feature=player_detailpage&v=J76eKCa5k70 http://www.youtube.com/watch?feature=player_detailpage&v=J76eKCa5k70 http://www.youtube.com/watch?feature=player_detailpage&v=J76eKCa5k70 jairo Nota Assista o vídeo do link e observe como a estatística influencia na criação de políticas públicas mais eficazes. Uso da estatística • Pesquisa de Opinião http://www.youtube.com/watch?feature=pla yer_detailpage&v=RVud2DCBiHg http://www.youtube.com/watch?feature=player_detailpage&v=RVud2DCBiHg http://www.youtube.com/watch?feature=player_detailpage&v=RVud2DCBiHg http://www.youtube.com/watch?feature=player_detailpage&v=RVud2DCBiHg jairo Nota Assista o link abaixo e observe como a pesquisa de opinião utiliza a estatística. Uso da estatística jairo Nota No futebol não poderia ser diferente. Acompanha o nº de passes, cruzamentos, finalizações, desarmes, dribles, chutes a gols, ente outras variáveis na busca de comparar times, seleções, jogadores em diversos campeonatos e a partir de então, tomar uma decisão qual o melhor time ou seleção do mundo. Áreas de Aplicação • Bioestatística; • Controle de qualidade; • Estatística comercial; • Estatística econômica; • Estatística engenharia; • Estatística física; • Estatística populacional; • Estatística psicológica; • Estatística social; • Física quântica; • Geoestatística; • Entre outras. Bioestatística é a Estatística aplicada às ciências da vida. jairo Nota Chegamos então na nossa disciplina - Bioestatística que é nada mais nada menos que a estatística aplicada a ciências da saúde/vida. Quando ela é aplicada com esse objetivo ou ponto de vista chamaremos de BIOestatística. Divisão da Estatística jairo Nota A bioestatística será divida em duas vertentes. 1 - Uma descritiva que como o próprio nome já diz possui o objetivo de descrever os achados e, portanto, irá realizar a coleta dos dados, a organização dos mesmos em banco de dados e descrever a informação não fazendo hipóteses, comparações ou até mesmo análise. 2 - A outra é a Estatística Analítica ou Inferencial que possui o objetivo de analisar, comparar, testar hipóteses para posterior tomada de decisão e predição. Amostra x População • População (N) é o conjunto de elementos para os quais se deseja estudar determinada(s) característica(s). • Amostra (n) é um subconjunto da população. Ela deve ser representativa. jairo Nota A primeira questão ao iniciar coleta e todos os outros passos é se você estará fazendo isso sobre a população ou sobre a amostra. Por isso você precisa entender o conceito de população (noção de todo) e amostra (um subconjunto da população). A amostra é representativa da população e possui as características que gostaria de estudar na população fazendo inferências sobre a mesma. A figura demonstra muito bem a visualização do que amostra e população. Guarde esse conceito pois irão ter métodos de como fazer essa AMOSTRAGEM. Variável estatística • São determinadas características de elementos da amostra de um interesse. • Dados - valores ou resultados que assumem das variáveis. jairo Nota Outro conceito importante na estatística é o de variável e dados.Quando falo assim: São 30 alunos casados - Aqui a variável é Estado Civil e o dado bruto 30. Mas pode ser peso, altura, sexo, e uma série de outras variáveis a depender do que você deseja estudar. Vamos ver mais na frente como elas também serão classificadas. Classificação das variáveis – Níveis de mensuração Qualitativas (Categórica) Quantitativas (númericas) Objeto de estudo jairo Nota As variáveis são classificadas quanto aos níveis de mensuração em: Variáveis qualitativas - aquelas que representam uma classificação dos indivíduos por tipos ou atributos. Exemplo: Sexo - Masculino e Feminino; Classificação do time no campeonato - Primeiro, oitavo; Cor dos olhos: Azul, castanho. E variáveis Quantitativas que expressam quantidades numéricas. Exemplo: Número de Filhos - 2; Idade: 22 anos. Essas classificações ainda serão classificada em outras categorias como veremos mais adiante. Classificação das variáveis jairo Nota Aqui está um resumo desta classificação que veremos uma por uma mais a frente. Exemplo: . Sexo (categórica pois classifica em Masculino e feminino) duas categorias apenas então ela é uma variável categórica dicotômica. . Peso (variável numérica - e valores não inteiros (82,660 kg) então é uma variável numérica contínua. . Número de filhos (variável numérica com valores inteiros (2 filhos)) então é uma variável numérica discreta. . Severidade de uma lesão (gave, branda e moderada, observe que existe uma ordem entre elas por nível de severidade - então ela é categórica possui mais de 3 categorias e existe uma ordem entre as categorias, portanto, ela é categórica ordinal. . Tipo Sanguíneo: O, Ab, A e B - possui categorias mas sem ordem entre elas, assim sendo ela é categórica nominal. Sempre que tiver uma variável busque fazer essa classificação representada pelo fluxograma que conseguirá classificá-la. Vamos entender melhor nos próximos slides. Variáveis Qualitativas • São definidas por várias categorias, ou seja, representam uma classificação dos indivíduos por tipos ou atributos. - Nominal: os valores são classificados em categorias ou classes não ordenadas. - Ordinal: quando a ordem entre as categorias se torna importante. jairo Nota Buscando entender melhor as classificações do fluxograma anterior, temos aqui as variáveis qualitativas que como vimos são aquelas que classificam os indivíduos por tipos ou atributos. Ela por sua vez é dividida em Nominal (quando não existe ordem entre as categorias) ou ordinal (quando existe ordem entre elas). Vamos ver alguns exemplos. Variáveis Qualitativas - Nominal: Exemplo: Sexo (1-Masculino e 2-Feminino); Tipo sanguíneo (1-tipo O, 2-tipo A, 3-tipo B, 4-tipo AB). - Ordinal: Exemplo: Nível de severidade de uma lesão: 1=fatal; 2=severa; 3=moderada 4=pequenas. Nível de instrução: 1=Analfabeto; 2=Ensino fundamental; 3=Ensino médio; 4=Graduação; 5=Mestrado; 6=Doutorado; 7=Pós-doutorado. jairo Nota Observem nos exemplos que se seguem a ordem ou não entre as categorias. Ela são categóricas por classificar os indivíduos. Variáveis Quantitativas • Expressam quantidades numéricas, ou seja, apresentam valores numéricos que fazem sentido. - Discretas: são características mensuráveis, ou seja, geralmente são o resultado de contagens. - Contínuas: assumem valores em uma escala contínua (na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas por meio de algum instrumento. jairo Nota Já aqui veremos as variáveis quantitativas que expressam valores numéricos e por sua vez serão classificadas em discretas quando seus resultados são números inteiros e resultados de contagens e contínuas quando assume valores de números não inteiros e geralmente são medidas por um instrumento. Vamos ver alguns exemplos. Variáveis Quantitativas - Discretas: Exemplos: N° de filhos; N° de medicamentos administrados. Nº de cigarros fumados durante o dia. - Contínuas: Exemplos: peso (balança), altura (régua), tempo (relógio), pressão arterial (aparelho de pressão), idade (anos/meses/horas). jairo Nota Responda as seguinte variáveis e observe dentro as suas resposta como se encaixam. Observações • Importante frisar que uma variável classificada como quantitativa pode se tornar qualitativa. Exemplo 1: Idade: 17 anos (discreta) – Faixa etária: 15 a 20 anos (categórica) jairo Nota Observação importante - na bioestatísticas dizemos que podemos brincar com os dados e dessa forma transformá-los. Vamos praticar • Classifique: Variável Qualitativa ordinal jairo Nota Agora sua vez - Vamos classificar segundo as imagens. Essa eu comecei mas as demais fica por sua conta. Vamos praticar • Classifique que tipo de variável segundo a imagem a seguir: jairo Nota classifique Vamos praticar • Classifique que tipo de variável segundo a imagem a seguir: jairo Nota Vamos lá e essa variável? Vamos praticar • Classifique que tipo de variável segundo a imagem a seguir: jairo Nota Classificação? Vamos praticar • Classifique que tipo de variável segundo a imagem a seguir: jairo Nota Essa daqui como é classificada? Vamos praticar • Classifique que tipo de variável segundo a imagem a seguir: jairo Nota Só mais uma. Estudo de caso • Identifique os dados, variáveis e classifique: • João, 43 anos, casado e pai de 5 filhos, internado já faz 5 dias no Hospital Municipal de Fortaleza, com temperatura alta, sentindo dor no peito entre 3 e 5 dias, sendo sujeito a cirurgia cardíaca. No pós-cirúrgico foi recomendado 20 doses de antiinflamatório de 100mg durantes 3 vezes ao dia. A pressão arterial estava controlada e 120 x 80 mmHg e foi solicitados que realizasse os exames de sangue, eletrocardiograma, ecocardiograma e urina para observar o quadro. jairo Nota Por fim, para finalizar nosso conhecimento sobre os tipos de variáveis observe o quadro a seguir e classifique as variáveis disposto no estudo de caso a seguir. Vamos praticar Dados Variável Classificação jairo Nota coloque no quadro a seguir e em seguida observe se está de encontro com o visualizado nos próximos slides. Dados Variável Classificação João Nome/Sexo Qualitativa Nominal 43 anos Idade Quantitativa discreta casado Estado Civil Qualitativa Nominal 5 filhos Número de filhos Quantitativa discreta 5 dias Tempo de Internação Quantitativa discreta Hospital Municipal Tipo de Hospital Qualitativa Nominal Alta Temperatura Qualitativa ordinal 3 a 5 dias Tempo de dor Quantitativa discreta Cirurgia Cardíaca Tipo de cirurgia Qualitativa nominal 24 doses Doses de medicamentos Quantitativa Discreta 100 mg Volume do Medicamento Quantitativa Discreta 3 x ao dia Frequência da dosagem Quantitativa Discreta 120 x 80 mmHg Pressão Arterial Quantitativa Contínua sangue, eletrocardiograma, ecocardiograma e urina Tipos de exames Qualitativa Nominal jairo Nota Eu encontrei as seguintes respostas e você? Resumindo jairo Nota Revisite os conceitos vistos e sigamos para os próximos passos. Classificação das variáveis – Grau de dependência Dependentes Independentes Objeto de estudo jairo Nota A outra classificação entre as variáveis além do nível de mensuração é o GRAU DE DEPENDÊNCIA - que diz se a variável estudada é dependente quando são variáveis que dependem de uma condição ou afetada pela uma variável independente (Exemplo: Diabetes) e variáveis independente são aquelas que influenciam a variável dependente como um fator que diminui ou aumenta (exemplo: Fatores de risco). Exemplo da DIABETES: Diabetes (Variável Dependente) com fatores de risco como Tabagismo, uso de álcool, inatividade física e alimentação não saudável (variáveis independentes). PERGUNTAS??? APONTAMENTOS????? jairo Nota Dúvidas? vamos abrir um fórum para tirar suas dúvidas. Organização e apresentação dos dados e variáveis Sintetizar Série de Valores Mesma Natureza (Visão Globalda Variação Valores) jairo Nota Os dados e variáveis serão organizados e apresentados em Tabelas ou gráficos e serão sintetizados por medidas descritivas que vocês já conhecem como Média, moda, mediana, entre outras. Vamos ver as medidas descritivas uma vez que tabelas e gráficos serão vistos nas aulas do laboratório de informática. Medidas Descritivas • Medidas de Posição: Média, Moda, Mediana; Separatrizes; Medidas de assimetria e Curtose; • Medidas de Dispersão: Amplitude de variância, Variância, Desvio padrão e Coeficiente de Variação. jairo Nota As medidas descritivas possuem o objetivo de sintetizar uma série de valores de mesma natureza dando uma Visão Global da Variação Valores. Elas por sua vez pode ser dividida em Medidas de posição e meidadas de dispersão. Vamos ver cada uma delas a seguir. Média (𝑋) • Para dados não Agrupados: • Somatório dos valores de todas as observações (indivíduos), dividido pelo número de observações (n), conforme a fórmula abaixo: jairo Nota A média ela é representada por um X com uma barra na parte superior. A média será calculada com dados não agrupados (aqueles que não são organizados e não estão separados por frequência) e com dados agrupados. A média para dados agrupados é calculada pela fórmula expressa no slide e é vista como o somatório das observações dividida pelo total de observações. Média (𝑋) • Suponha que a nota de dez alunos em bioestatística foram: 4 6 6 7 8 9 10 2 4 5 Baseado na média das notas, esses alunos estão acima ou abaixo da média? 𝑋 = 61/10 = 6,1 – Abaixo da Média jairo Nota Exemplo: primeiro observe que os dados não são agrupados - 4, 6, 6, 7, 8, 9, 10, 2, 4, e 5 - A média colocando na fórmula, eu irei somar todas as observações e dividi pelo total de observações = 61 dividido por 10 = = 6,1, ou seja, pela média dos alunos eles estão abaixo da média e o professor precisa tomar uma decisão para que eles melhorem. Agrupando dados - Intervalar • Idade dos alunos: 17, 17, 17, 17, 17, 18, 18, 18, 18, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 21, 21, 23, 24, 25, 26, 27. Classe fi Xi fi . Xi 17 – 19 9 17,4 156,6 19 – 21 10 19,7 197 21 – 23 2 21 42 23 – 25 2 23.5 47 25 – 27 2 25.5 51 27 – 29 1 27 27 Soma 26 - 520.6 jairo Nota Aqui demonstramos como agrupar dados não agrupados. Suponha que foram coletado os dados sobre a idade de 26 estudantes. Para agrupar você constrói uma tabela colocando classes agrupadas ou categorias (aqui nesse exemplo peguei a idade mínima e fiz cada classe com 2 anos posteriores - você pode escolher como formar essas classes). Em seguida você conta quantos elementos está dentro daquela categoria ou classe. No exemplo a seguir nos temos 9 elementos (fi) na classe entre 17 até 19 (OBS: o limite superior não entra nessa classe). Na coluna seguinte você calcula a média (Xi) dentro de cada classe e posteriormente abre uma outra coluna para a multiplicação da frequência dos elementos (fi) com a média (Xi) como no exemplo que se segue. Média (𝑋) • Para dados Agrupados por intervalo: jairo Nota Aqui o cálculo da Média para dados agrupados. Média para dados agrupados é igual a o somatório da multiplicação da Média por classe e frequência de cada classe dividido pelo o somatório das frequências em cada classe. Exemplo – dados agrupados • No Hospital Municipal o farmacêutico bioquímico recebe uma quantidade de exames de sangue para visualizar se média de Albumina entre eles está normal (3,5 a 5g). Se estiver alterada deve iniciar tratamento. Esses pacientes devem iniciar tratamento? jairo Nota Vamos resolver o exemplo que se segue. Média = 139 / 20 = 6,95. Conclusão- os exames dos pacientes estão alterados e precisam iniciar o tratamento. Vantagens x Desvantagens da X • Vantagens: Seu cálculo leva em consideração todos os indivíduos; Fácil entendimento. • Desvantagens: É influenciada por valores extremos; Em alguns casos não representa a série. jairo Nota Imagine no cálculo da média valores extremos como na figura a média está em torno de 300 e os valores entre 8000 e 1000 elevam a média, se valores menores levaria a média lá pra baixo. Mediana (Md) – Dados não agrupados • A mediana corresponde ao valor que divide o conjunto de informações em duas partes iguais (do meio). *Deve-se colocar os dados em ordem seja ela crescente ou decrescente. PAR ÍMPAR jairo Nota Mediana ou valor do meio é o valor que divide o número de elementos e, 2 grupos. Existe 2 situações a depender do número total de observações: . Se for ímpar como no exemplo têm 21 elementos o valor será o 11 lembrando que o primeiro passo sempre deve colocar as numerações em ordem crescente - Md = 0,8 . Se for Par como no exemplo com 18 elementos - a mediana será a média entre o nono e décimo elemento. lembrando que o primeiro passo sempre deve colocar as numerações em ordem crescente - Md = (0,7+0,8)/2 = 0,75 Mediana (Md) – Dados agrupados • 1º Passo – Descobrir a classe Md: n/2 • 2º Passo – cálculo • Onde: • Cálculo da Fant = soma das frequências anteriores a da classe Md. • Cálculo da amplitude do intervalo de classe (h) = diferença entre o limite anterior e superior da classe jairo Nota Para Mediana de dados agrupados deve seguir a fórmula que se segue e os passos 1 e 2. Lembrando que li é o limite inferior da Classe da mediana (Md), n frequência total, Fant é a soma das frequências anteriores a da Classe da mediana e Fmd é a frequência da classe da mediana e h é a amplitude do intervalo de classe calculada pela diferença entre o limite superior e inferior. Vamos ver um exemplo para entender melhor. Mediana (Md) – Dados agrupados • Vamos calcular – 1º passo – Classe Md 2º passo jairo Nota 1º Passo - Achar a classe da mediana (Md) = n/ 2 = 50 / 2 = 25. Dessa forma a classe mediana é aquela que contém o 25º elemento (observe que a terceira classe - 50 --- 55 contém esse elemento uma vez que a primeira só contém 3 elementos, a segunda 8 (totalizando 8 + 3 = 11 elementos), logo a próxima classe com 16 frequências (11 com 16 = 37 elementos) contém o elemento 25 e, portanto, é a classe Md. 2º Passo - Fórmula li = 50, n = 50, Fant = 3+8 = 11, Fmd = 16 e h = 55 - 50 = 5; Logo: Md = 50 + (((50/2) - 11)/ 16) x 5 = 50 + ((25-11)/16) x 5 = 50 + (14/16) x 5 = 50 + 0.875 x 5 = 50 + 4.375 = 54.375 Vantagens e Desvantagens da Md • Vantagens – Não Sofre influência de valores extremos; Utilizada principalmente para assimetrias. • Desvantagens – Não é levada em consideração pelos testes estatísticos – baseia-se na ordenação de valores e não na sua expressão numérica – pouco capaz de sofrer tratamento estatístico (desconheço teste estatístico que use mediana) jairo Nota Possui suas vantagens e desvantagens jairo Nota Olha um exemplo interesse se você pegar a média dos indivíduos em uma corrida iria para 05 Kg e provavelmente você diria que os atletas estão com sobrepeso ou obesidade e faria uma intervenção errada sobre eles. Mas ao calcular a Mediana achará o valor do meio entre os atletas. Moda (Mo) – dados não agrupados • A moda é o valor mais frequente de uma amostra, ou seja, é o valor que detém o maior número de observações. {1, 2, 3, 3, 3, 4, 4, 5, 6} = Mo = 3 • Algumas amostras podem ter mais de uma moda (Bimodal, Multimodal); {1, 2, 3, 3, 3, 4, 4, 4, 5, 6} = Mo = 3 e 4 • Algumas vezes a amostra pode não ter moda (Amodal) {1, 2, 3, 4, 5, 6} = Sem moda jairo Nota Moda é o valor mais frequente. No exemplo que segue o valor 3 aparece 3 vezes no conjunto e, portanto, detém o maior número de observações. Observe que pode ter situações onde o conjunto terá mais de um moda ou até mesmo nenhuma moda. Moda (Mo) – dados agrupados 1º Passo: Encontrar a Classe Mo: aquela que contém a maior frequência; 2º Passo: Cálculo jairo Nota Uma observação para modas em grupo de dados não agrupados. Primeiro encontrar a classe daModa que é aquela com maior frequência entre todas as classes. Em seguida joga os dados na fórmula. Vamos exemplificar em seguida. Moda (Mo) – dados agrupados • 1º Passo: Classe Mo • 2º Passo: jairo Nota A classe da moda é a entre 50 --- 5 pois contém 16 frequência. Achei a classe da moda (1º passo). Agora só jogar na fórmula. li = 50, fi+1 = 12, fi - 1 = 8, h = 55 - 50 = 5; Mo = 50 + (12/(12 + 8)) x 5 = 50 + (12/20) x 5 = 50 + 0.6 x 5 = 50 + 3 = 53 Separatrizes • São valores que separam o rol (os dados ordenados) em dois (mediana) quatro (quartis), dez (decis) ou em cem (percentis) partes iguais. jairo Nota Aqui estudaremos as Separatrizes que dividem um conjunto de dados em QUARTIS (quatro partes iguais), Decis (dez partes iguais) e percentis (cem partes iguais). Vamos ver um por um. Cálculo das Separatrizes – Dados não agrupados • Qi = (i/4)(n+1) Di = (i/10)(n+1) Pi = (i/100)(n+1) OBS: se for par a amostra colocar n + 2. Ex: Y = {180, 190, 200, 210, 220, 240, 260} Q1 = 0,25 (7+1) = 2ª posição = 190 jairo Nota Cálculo do quartis (Qi) = i(o número do quartil que deseja pesquisar) / 4 multiplicado pelo número de observações somado 1 (quando o número de observações for ímpar) ou somado 2 (quando o número de observações for par. No exemplo que segue n = 7 (7 elementos). Suponha que você queira calcular o quartil 1 dessa forma Q1 = (1/4) x (7+1) Q1 = 0.25 x 8 = 2 2ª posição representa então o elemento 190 no conjunto. Da mesma forma você faria com o Decil e percentil. Só substituir na fórmula. Cálculo das Separatrizes – Dados agrupados • 1º Passo: Determinar a Posição da Separatriz (como nos dados não agrupados) • 2º Passo: Localizar a classe da separatriz • 3º Passo Cálculo jairo Nota Para dados agrupados deve-se seguir os 3 passos que se segue e jogar nas fórmula. Vamos exemplificar. Cálculo das Separatrizes – Dados agrupados • Q3? • 1º Passo: Determinar a Posição da Separatriz (como nos dados não agrupados) = Q3 = (3/4) (50+1) = (0.75) . (51) = 38.25 • 2º Passo: Localizar a classe da separatriz • 3º Passo Cálculo jairo Nota Suponha que você deseja saber qual o quartil 3 (Q3) 1º Passo - Determinar a posição da Separatriz - Q3 = (3/4) x (50+1) Q3 = 0.75 x 51 Q3 = 38.25 2º Passo: a classe que contém o 38.35 elemento é 55 ---- 60 (você conta a frequência das classes até achar aquela que tenha esse elemento - observe que as 3 primeiras só possuem 27 elementos a próxima classe termina com 39 elemento então essa será a classe da separatriz) 3º Passo: Jogar na fórmula Q3 = 55+ (((3 x 50/4) - 27)/12) x 5 Q3 =55 + ((37,5 - 27)/12) x 5 Q3 = 55 + (10.5/12) x 5 Q3 = 55 + 0.875 x 5 Q3 = 55 + 4.375 Q3 = 59.375 Para separatrizes e percentis é só usar as demais fórmulas PERGUNTAS??? APONTAMENTOS????? Medidas de Dispersão • A variabilidade/dispersão de dados expressam no conjunto de dados observações de distribuições próximas ou que variam muito. • São: Amplitude de Variação, da Variância, do Desvio-padrão e do Coeficiente de Variação. jairo Nota Essas medidas expressam a variabilidade dos dados - dados que variam muito não são muito confiáveis para tomada de decisão. jairo Nota Esse será o exemplo dos cálculos que iremos fazer das medidas de dispersão. Observe como o gráfico de biologia está bem distribuído enquanto que matemática está bem disperso. Amplitude de Variação • Calculada pela diferença entre o maior e o menor valor de uma distribuição de dados. AmpBio = 7 – 3 = 4 AmpMat = 10 – 2 = 8 Mais dispersão Mais Amplitude de Variação jairo Nota Essa será a primeira medida - Amplitude de Variação que é calculada pela diferença entre o maior valor e o menor valor. Calculando a amplitude de variação das notas de biologia e matemática observe que a Amplitude de Matemática (AmpMat) varia mais que a de Biologia como demonstrado no gráfico. Variância (S²) • Mede a dispersão dos dados em torno da média. • Onde: jairo Nota Essa medida por sua vez avalia o quanto os dados estão disperso ao redor da média e é conhecido por s² calculada pelo somatório dos quadrados das diferenças dos valores observados com a média de distribuição dividida pelo tamanho da amostra. Vamos para o exemplo. Variância (S²) • Vamos pegar o exemplo da Biologia e Matemática: • Vamos calcular: • S² Bio = 1,09 • S² Mat = 8,54 jairo Nota Calcula a média = 5 S² de Biologia = (5 - 5)² + (6 - 5)² + (5 - 5)² + (4 - 5)² + (5 - 5)² + (5 - 5)² + (5 - 5)² + (6 - 5)² + (4 - 5)² + (7 - 5)² + (3 - 5)² + (5 - 5)² / 12 - 1 = 1,09 Fazendo o mesmo cálculo para matemática S² irá ter o valor de 8,54 confirmando a variabilidade dos dados. Desvio padrão (S) • Estima o quanto, em média, cada valor se distancia da própria média aritmética de uma distribuição. • Calculado pela Raiz quadrada da Variância • Logo, • S Bio =√1,09 = 1,04 • S Mat = √8,54 = 2,92 jairo Nota Já o desvio padrão é calculado pela Raiz quadrada da variância e representado pela letra S. Fazendo a raiz quadrada das variância de Biologia e Matemática demonstra mais uma vez a variabilidade e dispersão das notas de Matemáticas. Coeficiente de Variação • Refere-se à divisão entre o desvio padrão e a média de uma distribuição. • Verifica o quanto os dados variam em relação à média • Abaixo de 25% o CV será considerado baixo jairo Nota Por último o coeficiente de variabilidade que é calculado pela divisão do desvio padrão pela média e multiplicado por 100. Vamos ver o exemplo a seguir. Coeficiente de Variação • Compare a variabilidade relativa do tempo de reação de um analgésico A com a variabilidade do peso das pessoas que se submeteram à dosagem desse analgésico. As médias e os desvios padrão foram: - Analgésico A: X ̅=3 min e s = 0,71 - Peso das pessoas: X ̅=58,25 kg e s = 5,17 jairo Nota Suponha um conjunto de dados relativos ao tempo de um analgésico em relação ao peso das pessoas e considerando a média e desvio padrão que segue iremos calcular a seguir. Coeficiente de Variação • Cálculo para o tempo de reação do analgésico: CV = 0.71/3 x 100 = 23,67% • Cálculo para o peso das pessoas: CV = 5.17/58.25 x 100 = 8,88% • Comparando o CV do tempo de reação do analgésico e o do peso das pessoas, podemos concluir que os dados referentes ao peso são mais homogêneos que os do tempo de reação do analgésico. jairo Nota Observa-se então que os dados de tempo de reação do analgésico varia muito mais que o dos dados dos peso das pessoas. Sendo então mais heterogêneo. Exercícios de Fixação • Está anexado ao SIGAA e deve ser entregue um pelo grupo formado na disciplina de Saúde Coletiva (aquele inicial do Jogo da Moeda) jairo Nota Vamos praticar respondendo ao exercício de fixação anexado ao Sigaa. Bons Estudos.
Compartilhar