Baixe o app para aproveitar ainda mais
Prévia do material em texto
IntroduçãoIntrodução à à BioestatísticaBioestatística Prof. Prof. Carolina Silva PenaCarolina Silva PenaProf. Prof. Carolina Silva PenaCarolina Silva Pena Departamento de Estatística Universidade Federal de Minas Gerais carolinasend@gmail.com 127 Bioestatística � O crescente desenvolvimento de pesquisas na área biológica permite elevar, cada vez mais, a longevidade, aumentar a qualidade de vida, eliminar ou controlar doenças, entre outros benefícios. Dentro desse contexto, cresce também a Bioestatística, já que a comprovação de resultados experimentais e sua posterior publicação devem ser feitas mediante a utilização de métodos de análise estatística Principais Aplicações � Avaliar a eficácia de tratamentos quando comparados a um grupo controle � Comparar tratamentos entre si � Identificar fatores de risco � Fazer previsões � Calcular o risco associado a diferentes perfis de indivíduos � Determinar pontos de corte que maximizem a eficácia de testes biomédicos 227 Utilização da Estatística na Farmácia � Testes de Bioequivalência : � São equivalentes farmacêuticos ou alternativas farmacêuticas que, ao serem administrados na mesma dose molar, nas mesmas condiçõesmolar, nas mesmas condições experimentais, não apresentam diferenças estatisticamente significativas em relação à biodisponibilidade. 327 Tópicos Abordados na Disciplina � Análise Descritiva e Exploratória de dados � Introdução à Probabilidade � Avaliação da Qualidade de Testes de Diagnóstico _______________________________________________ Modelo Probabilísticos e Aplicações� Modelo Probabilísticos e Aplicações � Introdução à inferência Estatística ____________________________________________ � Testes de Hipótese 427 Informações Importantes � 3 Provas de 30 pontos cada � 1a Prova: 18/09 � 2a Prova: 23/10 � 3a Prova: 27/11 � Listas de exercícios: 10 pontos Bibliografia: � Noções de Probabilidade e Estatística Marcos Nascimento Magalhães Antônio Carlos Pedroso de Lima � Introdução à Bioestatística Médica José Francisco Soares, Arminda Lucia Siqueira � http://www.est.ufmg.br/~edna/introbio.htm (Apostila de textos) 527 Introdução Introdução � Convencionou-se chamar de Bioestatística o conjunto de métodos estatísticos usados no tratamento da variabilidade nas ciências médicas e biológicas. A Bioestatística fornece métodos para se tomar decisõesfornece métodos para se tomar decisões ótimas na presença de incerteza, estabelecendo faixas de confiança para a eficácia dos tratamentos e verificando a influência de fatores de risco no aparecimento de doenças. 627 Tabela de dados Brutos Informações sobre estado civil, escolaridade, número de filhos, salários (em salários mínimos), idade (anos) e região de origem dos empregados de uma empresa MB 727 Definições Estatística Descritiva: Consistência dos dados Interpretações iniciais Probabilidade: Teoria matemática Fenômenos aleatórios Inferência: Extrapolação (população) População: conjunto de todos os indivíduos de interessePopulação: conjunto de todos os indivíduos de interesse Amostra: subconjunto da população – “o mais parecido possível com a respectiva população” Amostra sem reposição com reposição 827 Definições � Variável: característica de interesse variável Qualitativa Quantitativa Nominal : ex. [“sim”, “não”], [“A”, “B”, “C”] Ordinal : ex. [“quente”, “morno”, “frio”] Discreta Quantitativa Contínua Frequência absoluta: contagem da ocorrência de valores de variável Frequência relativa: socorrênciadetotalnúmero valorodeterminadumdeocorrênciadenúmero =f 927 Definições � Variáveis quantitativas discretas – podem ser vistas como resultantes de contagens, assumindo assim, em geral, valores inteiros.O conjunto de valores é finito ou inteiros.O conjunto de valores é finito ou enumerável. � Variáveis quantitativas contínuas – assumem valores em intervalos dos números reais e, geralmente, são provenientes de uma mensuração. 1027 Estatística Descritiva � Descobrindo o óbvio? O que parece ser simplesmente uma foto de grãos de café, porém não é. Existe a face de um homem entre os grãos. Segundo dizem, se você conseguir encontrar o homem em 3 segundos ou menos a sua parte direita do cérebro é mais desenvolvida do que a maioria. 1127 Descrição e Apresentação de Descrição e Apresentação de Dados (Estatística Descritiva)Dados (Estatística Descritiva) �� Exemplo: Exemplo: Em 1969 foi realizado um estudo na população de Honolulu. Para 7.683 indivíduos foram pesquisadas as seguintes variáveis: nível educacional, peso (kg), altura variáveis: nível educacional, peso (kg), altura (cm), idade (anos), glicemia (mg/dL), colesterol sérico (mg/dL) e pressão sistólica (mmHg). Cada indivíduo foi classificado quanto ao hábito 1227 Base de DadosBase de Dados ID EDUCATIONA L LEVEL WEIGHT (KG) HEIGHT (CM) AGE SMOKING STATUS PHISICAL ACTIVITY AT HOME BLOOD GLUCOSE SERUM CHOLESTERO L SYSTOLIC BLOOD PRESSURE 1 2 70 165 61 1 1 107 199 102 2 1 60 162 52 0 2 145 267 138 3 1 62 150 52 1 1 237 272 190 4 2 66 165 51 1 1 91 166 122 5 2 70 162 51 0 1 185 239 128 6 4 59 165 53 0 2 106 189 112 7 1 47 160 61 0 1 177 238 128 8 3 66 170 48 1 1 120 223 116 9 5 56 155 54 0 2 116 279 1349 5 56 155 54 0 2 116 279 134 10 2 62 167 48 0 1 105 190 104 11 4 68 165 49 1 2 109 240 116 12 1 65 166 48 0 1 186 209 152 13 1 56 157 55 0 2 257 210 134 14 2 80 161 49 0 1 218 171 132 15 3 66 160 50 0 2 164 255 130 16 4 91 170 52 0 2 158 232 118 17 3 71 170 48 1 1 117 147 136 18 5 66 152 59 0 2 130 268 108 19 1 73 159 59 0 2 132 231 108 20 4 59 161 52 0 1 138 199 128 21 1 64 162 52 1 1 131 255 118 22 3 55 161 52 1 1 88 199 134 1327 Tabela de Frequência Variável ni fi fac valor 1 valor 2 valor p Total n= 1 fac = frequências acumuladas M fac = frequências acumuladas x ni fi fac A 38 0,38 0,38 B 20 0,20 0,58 C 42 0,42 1,00 Total 100 1427 Tabela de Frequência Número de Filhos Frequência ni Frequência relativa fi 0 1 2 3 4 5 4 5 7 3 0 1 0,20 0,25 0,35 0,15 0,00 0,05 Total 36 1,00 Distribuição dos empregados da empresa segundo o número de filhos Salário Frequência ni Frequência relativa fi 04|----08 08|----12 12|----16 16|----20 20|----24 10 12 8 5 1 0,2778 0,3333 0,2222 0,1389 0,0278 Total 36 1,00 Distribuição dos empregados da empresa segundo o salário 1527 Introdução aos Gráficos � Gráficos � Disco � Barras (variável versus frequência) � Histograma (polígono de frequência) � Histograma (original): variável versus densidade. Possui área total igual a 1. Retângulos contíguos com área igual à frequência relativa (densidade de frequência). As densidade de cada faixa podem ser obtidas dividindo-se a frequência relativa pela amplitude da faixa. 1627 Escolaridade Grau de escolaridade Frequência ni Frequência Relativa fi 1º grau 2º grau 3º grau 12 18 06 0,3333 0,5000 0,1667 Total 36 1,0000 Figura 1: Distribuição dos empregados da empresa MB segundo grau de instrução Figura 2: D istr ibuição dos empregados da empresa MB segundo grau de instrução 0 5 10 15 20 1o. Grau 2o. Grau superior F r e q u ê n c i a Grau de Instrução 2o. Grau 50% superior 17% 1o. Grau 33% 1727 Histogramas 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 D e n s i t y Figura 4: Histograma para o salário dos empregados Densidade = Frequência Relativa Amplitude Figura 5: Histograma para o salário dos empregados 2420161284 0.00 Salario 2420161284 30 20 10 0 Salario P e r c e n t 1827 Histograma 30 20 10 0 P e r c e n t Figura 6: Histograma para o salário dos empregados No histograma as frequências dos intervalos são representadas pelas áreas dos retângulos. Então as áreas dever ser iguais às frequências ou devem guardar a mesma proporcionalidade com as freqüências, isto é área = k f(x), Neste caso isto não acontece. Observe que no 24161284 0 Salario Neste caso isto não acontece. Observe que no último intervalo a área= 8 f(x), diferente dos outros onde a área = 4 f(x). Portanto este histograma não está correto. 1927 Histograma 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 D e n s i t y Figura 7: Histograma para o salário dos empregados Este histograma está correto. No eixo vertical colocamos a densidade = (frequência/ largura do intervalo). Deste modo, a área de cada retângulo é exatamente a frequência de 24161284 0.01 0.00 Salario é exatamente a frequência de cada intervalo. 2027 Medidas de Posição (Tendência Central) 1. Média (amostral) Sejam x1, x2, ..., xn observações da variável X n x x n i i∑ = = 1 ou na forma: ∑ ∑ = = == k i i i k i ii x n n n xn x 1 1 x é o valor observado da variável de interesse para o indivíduo i,xi é o valor observado da variável de interesse para o indivíduo i, n é o tamanho da amostra. Exemplo: {98, 102, 100, 99, 97, 100, 96, 95, 99, 100} 6,98 10 100 99 95 96 100 97 99 100 102 98 = +++++++++ =x 2127 Média ∑ ∑ = = == k i i i k i ii x n n n xn x 1 1 A fórmula acima é utilizada quando temos dados tabelados. Observações Frequência 95 1 96 196 1 97 1 98 1 99 2 100 3 102 1 6,98 10 10211003992981971961951 = ++++++ = xxxxxxx x 2227 Medidas de posição 2. Mediana md: é o valor que ocupa a posição central dos dados ordenados também representada como: � Como calcular a mediana?? � Ordenar o conjunto de dados � Ordenar o conjunto de dados � Deve-se saber que pelo menos 50% dos valores são menores ou iguais a mediana � E que pelo menos 50% dos valores são maiores ou iguais a mediana 2327 Mediana – Conjunto Impar � Exemplo: {98, 102, 100, 99, 97, 100, 96, 95, 99, 100, 110} � Dados ordenados: {95 96 97 98 99 99 100 100 100 102 110} � Temos 11 observações Quantidade Impar. 11 x 0,5 = 5,5 � pelo menos 5,5 (6) observações menores ou iguais a mediana � pelo menos 5,5 (6) observações menores ou iguais a mediana � pelo menos 5,5 (6) observações maiores ou iguais a mediana � {95 96 97 98 99 99 100 100 100 102 110} Mediana 2427 Mediana – Conjunto Par � Exemplo: {98, 102, 100, 99, 97, 100, 96, 95, 99, 100} � Dados ordenados: {95 96 97 98 99 99 100 100 100 102 } � Temos 10 observações Quantidade Par. 10 x 0,5 = 5 . � Pelo menos 5 observações menores ou iguais a mediana � Pelo menos 5 observações maiores ou iguais a mediana� Pelo menos 5 observações maiores ou iguais a mediana � {95 96 97 98 99 99 100 100 100 102} Mediana = (99+99)/2 = 99 2527 Moda 1. Moda mo: é o valor mais freqüente. exemplo: {98, 102, 100, 99, 97, 100, 96, 95, 99, 100} Observações Frequência 95 1 96 1 97 1 98 1 99 2 100 3 102 1 Moda 2627 Média versus Mediana x Média Mediana amostra 2727
Compartilhar