Baixe o app para aproveitar ainda mais
Prévia do material em texto
30/08/2016 1 BIOESTATISTICA DISCIPLINA BASES PARA PESQUISA CIENTIFICADISCIPLINA BASES PARA PESQUISA CIENTIFICADISCIPLINA BASES PARA PESQUISA CIENTIFICADISCIPLINA BASES PARA PESQUISA CIENTIFICA PROFESSORA: RENATA BANDEIRA LAGESPROFESSORA: RENATA BANDEIRA LAGESPROFESSORA: RENATA BANDEIRA LAGESPROFESSORA: RENATA BANDEIRA LAGES CONCEITOS BASICOSCONCEITOS BASICOSCONCEITOS BASICOSCONCEITOS BASICOS O Que é Estatística ? “Estatística é um conjunto de técnicas e métodos que nos auxiliam no processo de tomada de decisão na presença de incerteza.” Ciência de aprendizagem a partir de dados. Auxiliam a tomar decisões, na presença de incerteza. Por que a Bioestatística e importante ? Bioestatística Básica • Condução e avaliação de uma pesquisa • Comparação entre dois ou mais grupos ou amostras (grupo tratado / grupo controle) • Detectar variáveis interferentes • Analisar se o tratamento depende de outras variáveis (peso, idade, sexo) 30/08/2016 2 DADOS E ESTATÍSTICA VARIÁVEL CATEGÓRICA (qualitativa) NUMÉRICA (quantitativa) Nominal Ordinal Discreta Continua ----------------------------------------------- São representados por porcentagem -------------------------------------------------- São representados por média±desvio Padrão ou mediana (intervalo entre Quartis), etc • DADOS CATEGÓRICOS (QUALITATIVOS) Dados nominais- são dados que se definem exclusivamente por nomes (não são mensurados), ex: grupo sanguineo (A, AB, B e O), estado civil (casado/viúvo/solteiro,etc), raça, sexo. Dados Ordinais – os dados são ordenados de alguma maneira (incluem escalas). Ex: estadiamento de doença (avançada, moderada, branda, nenhuma), grau da dor (forte, moderada, branda, nenhuma). Obs: existem as variáveis binárias cuja resposta é sim/não ou vivo/morto. DADOS E ESTATÍSTICA • Nome- Fulano de Tal • Sexo- Masculino • Idade – 50 anos • Etnia – caucasiano • Tipo sanguineo – A • Peso – 60 kg • Creatinina 0.8mg/Dl QUAIS SÃO DADOS CATEGÓRICOS? NOMINAIS? ORDINAIS ? DADOS CATEGÓRICOS Nome- Fulano de Tal • Sexo- Masculino • Idade – 50 anos • Etnia – caucasiano • Tipo sanguineo – A • Peso – 60 kg • Creatinina -0.8mg/Dl DADOS CATEGÓRICOS NOMINAIS? ORDINAIS ? DADOS CATEGÓRICOS Grupo sanguineo Número Porcentagem A 20 19.0 B 25 23.8 AB 10 9.5 O 50 47.6 DADOS E ESTATÍSTICA VARIÁVEL CATEGÓRICA (qualitativa) NUMÉRICA (quantitativa) Nominal Ordinal Discreta Continua ----------------------------------------------- São representados por porcentagem -------------------------------------------------- São representados por média±desvio Padrão ou mediana (intervalo entre Quartis), etc 30/08/2016 3 • DADOS NUMÉRICOS Dados discretos- só podem assumir valores numéricos inteiros, ex: número de consultas médicas, número de episódios de uma enfermidade. Dados contínuos- podem existir valores intermediários, ex: peso, altura, uréia, creatinina, hemoglobina. DADOS E ESTATÍSTICA • Nome- Fulano de Tal • Sexo- Masculino • Idade – 50 anos • Etnia – caucasiano • Tipo sanguineo – A • Peso – 60 kg • Creatinina 0.8mg/Dl QUAIS SÃO DADOS NUMERICOS? DISCRETOS ? CONTINUOS ? DADOS NUMÉRICOS • Nome- Fulano de Tal • Sexo- Masculino • Idade – 50 anos • Etnia – caucasiano • Tipo sanguineo – A • Peso – 60 kg • Creatinina 0.8mg/Dl DADOS NUMÉRICOS DISCRETOS ? CONTINUOS ? DADOS E ESTATÍSTICA VARIÁVEL CATEGÓRICA (qualitativa) NUMÉRICA (quantitativa) Nominal Ordinal Discreta Continua ----------------------------------------------- São representados por porcentagem -------------------------------------------------- São representados por média±desvio Padrão ou mediana (intervalo entre Quartis), etc - Variáveis (dados): - Qualitativos ou nominais: sexo, cor, grupo sanguíneo, causa da morte - Ordinais: (ordenação natural): Grau de instrução, aparência, estágio da doença, status social - Quantitativos ou Contínuos: (dados expressos por nº): idade, altura, peso - População e Amostra: - População: Conj. de elementos com determinada característica - Amostra:Subconjunto com menor nº de elementos - Independentes: grupo selecionados com tratamento distinto - Dependentes: para cada elemento do grupo tratado existe um grupo controle semelhante (sexo, idade, etc) POPULAÇÃO: Conjunto de elementos que se deseja estudar AMOSTRA: Subconjunto da população Nem sempre o Censo é viável (questões econômicas) É mais barato coletar dados de amostras População Amostra 30/08/2016 4 REQUISITOS DE UMA AMOSTRA: 1) Ter um tamanho adequado (previamente calculado) Existem fórmulas para o cálculo do adequado tamanho da amostra 2) Constituintes selecionados ao acaso (sorteio) CLASSIFICAÇÃO DO TAMANHO DA AMOSTRA: Amostras Grandes: n > 100 Amostras Médias: n > 30 (30 < n < 100) Amostras Pequenas: n < 30 (12 < n < 30) Amostras Muito Pequenas: n < 12 Observação: As amostras com n > 30 geram melhores resultados. O tamanho adequado deve ser pré-calculado. Amostragem e Planejamento de Experimentos (coleta dos dados) Estatística Descritiva (organização, apresentação e sintetização dos dados) Estatística Inferencial (testes de hipóteses, estimativas, probabilidades) Áreas da Estatística Amostragem e Planejamento de Experimentos (coleta dos dados) - É o processo de escolha da amostra - É o início de qualquer estudo estatístico - Consiste na escolha criteriosa dos elementos a serem submetidos ao estudo Estatística Descritiva (organização, apresentação e sintetização dos dados) - É a parte mais conhecida - Diariamente veiculada na mídia (jornais, televisão, rádio) - Distribuições de frequência, médias, tabelas, gráficos Estatística Inferencial, Indutiva ou Analítica (testes de hipóteses, estimativas) - Auxilia o processo de tomada de decisões - Responde uma dúvida, compara grupos - Testam-se 2 hipóteses (hipótese nula e hipótese alternativa), sendo que uma delas será aceita mediante a aplicação de um teste estatístico baseado na teoria das probabilidades. Tipos de estudo • Estudos observacionais, onde não se tem controle dos dados obtidos; • Estudos experimentais, onde o pesquisador pode controlar o processo de obtenção dos dados; • Estudos retropectivos (caso controle): iniciados depois que os indivíduos desenvolveram a condição de interesse . Comparam os indivíduos com a condição (casos) com indivíduos sem a condição (controle); 30/08/2016 5 Tipos de Estudos � Estudo transversal: dados são observados, medidos e coletados em um ponto no tempo. � Estudo prospectivo ou longitudinal ou de coorte: os dados são coletados no futuro, de grupos (coortes) que compartilham fatores comuns. Confundimento: ocorre em um experimento quando o pesquisador não está apto a distinguir os efeitos de diferentes fatores. Características desejáveis nas Amostras • A primeira delas é a representatividade ( ou critério de proporcionalidade), onde características observáveis e conhecida devem ser reproduzidas na amostra; • A fidedignidade representa a precisão (ou qualidade) dos dados obtidos. Levantamento de dados • Problemas usuais - Representatividade – Fator associado à forma de amostragem. – Na seleção da amostra procura-se reproduzir as características observáveis da população - uso do critério de proporcionalidade. – Em caso de desconhecimento da composição da população deve-se utilizar algum critério de aleatoriedade (sorteio). – Amostra tendenciosa – conclusões sem consistência. Coleta de Dados • É uma etapa mais importante de um trabalho; • Deve ser planejada adequadamente para garantir representatividade e fidedignidade e minimizar os efeitos colaterais; • Exige a definição adequadada forma de coleta dos dados; • Cálculo do tamanho amostral, ou dimensionamento amostral. Amostragem • Definição – entende-se por amostragem o processo de obtenção de amostras ( ou subconjutos) a partir de uma população definida previamente. • Considerar esta etapa desde o planejamento de toda a análise estatística desejada. Amostragem • Principais técnicas de amostragem • Para isso vamos supor que temos uma população finita N. • Com essa notação vamos ilustrar os métodos de coleta de amostras de tamanho n. 30/08/2016 6 Amostragem • Amostragem aleatória simples (AAS) – é o método mais importante, ele é feito através de uma seleção no n amostral através de sorteio ao acaso. • Amostragem por conglomerado - onde por algum motivo são selecionados (conglomerados), podendo esses serem, grupos, bairros, classe... • Amostragem sistemática, assume-se que o N elementos das população podem ser escritos como N= kn, como K sendo um número inteiro, que todos os seus elementos podem ser ordenados. População • Definição – é um conjunto de indivíduos que apresentam uma característica de interesse. Em uma cidade de 500.000 habitantes onde 45% das pessoas tem título de eleitor, realizou-se uma pesquisa eleitoral com 2000 pessoas. Qual o tamanho da população de estudo e da amostra? A pesquisa proposta e experimental ou de levantamento? Por quê? � Dados Nominais (Sexo, Raça, Cor dos Olhos) � Dados Ordinais (Grau de Satisfação) � Dados Numéricos Contínuos (Altura, Peso) � Dados Numéricos Discretos (Número de Filiais) “Estatísticas aplicadas em alguns tipos de dados não podem ser aplicadas a outros .” TIPOS DE DADOS 1ª Regra: Arredondar para o número mais próximo 2ª Regra: Arredondar para o par mais próximo 5,0 5,5 6,0 6,0 6,5 7,0 ARREDONDAMENTO DE DADOS CONTÍNUOS Faça os seguintes arredondamentos: 38,648 para o centésimo mais próximo 54,76 para o décimo mais próximo 27,465 para o centésimo mais próximo 42,455 para o centésimo mais próximo 4,5 para o inteiro mais próximo 30/08/2016 7 AGRUPAMENTO DE DADOS POR VALORES DISTINTOS 8 2 5 6 5 6 5 4 3 7 5 6 5 4 7 2 5 4 6 5 3 6 5 4 2 5 3 6 x f (frequência) 2 3 3 3 4 4 5 9 6 6 7 2 8 1 Total 28 POLÍGONO DE FREQUÊNCIA x f 2 3 3 3 4 4 5 9 6 6 7 2 8 1 Total 28 f x 10 8 6 4 2 2 3 4 5 6 7 8 Apresentação dos Dados em Tabelas: - Componentes das tabelas: - Título: Explica o conteúdo - Corpo: Formado pelas linhas e colunas dos dados - Cabeçalho: específica o conteúdo das colunas - Coluna indicadora: específica o conteúdo das linhas - Opcional: fonte, notas, chamadas Nascidos vivos no Maternidade do HRAS segundo o ano de registro Título Cabeçalho (separado do corpo por um traço horizontal) Ano de Registro Freqüência Freqüência relativa 1998 (1) 8328 32,88 (8828/25494) 1999 (1) 8214 32,22 2000 (1) 8898 34,90 Coluna indicadora Total 25494 100 Fonte: Margotto, PR (2001) Nota: dados retirados do livro da sala de parto (1): os RN < 500g não foram incluídos. (chamadas) Tabela de Contingência ou de Dupla Entrada (cada entrada é relativa a um dos fatores) Gestantes sem pré-natal/gestantes com pré-natal e mortalidade perinatal Fator Mortalidade Pré-natal Total Sim Não Gestantes sem pré-natal 55 833 938 Gestantes com pré-natal 156 6720 6876 Permite calcular o risco, a freqüência (incidência) entre expostos e não expostos a um determinado fator (será discutido adiante). - Tabelas de distribuição de freqüências: Peso ao nascer de nascidos vivos, em Kg 2,522 3,200 1,900 4,100 4,600 3,400 2,720 3,720 3,600 2,400 1,720 3,400 3,125 2,800 3,200 2,700 2,750 1,570 2,250 2,900 3,300 2,450 4,200 3,800 3,220 2,950 2,900 3,400 2,100 2,700 3,000 2,480 2,500 2,400 4,450 2,900 3,725 3,800 3,600 3,120 2,900 3,700 2,890 2,500 2,500 3,400 2,920 2,120 3,110 3,550 2,300 3,200 2,720 3,150 3,520 3,000 2,950 2,700 2,900 2,400 3,100 4,100 3,000 3,150 2,000 3,450 3,200 3,200 3,750 2,800 2,720 3,120 2,780 3,450 3,150 2,700 2,480 2,120 3,155 3,100 3,200 3,300 3,900 2,450 2,150 3,150 2,500 3,200 2,500 2,700 3,300 2,800 2,900 3,200 2,480 - 3,250 2,900 3,200 2,800 2,450 - Como transformar está tabela em uma Tabela de Distribuição de Freqüência ? Menor peso: 1570g Maior peso: 4600g 30/08/2016 8 - Tabelas de distribuição de freqüências: 3 colunas Definir as faixas de peso (Classes): Classe Ponto Médio Freqüência 1,5Ι— 2,0 1,75 3 2,0Ι— 2,5 2,25 16 2,5Ι— 3,0 2,75 31 3,0Ι— 3,5 3,25 34 3,5Ι— 4,0 3,75 11 4,0 Ι— 4,5 4,25 4 4,5Ι— 5,0 4,75 1 - Intervalo de classe (0,5Kg): intervalo coberto pela classe - Extremo de classe:limites dos intervalos de classe 1,5 Ι— 2,0: fechado a esquerda (não pertencem a classe os Valores ≥ 2; pertencem a classe os valores ≥ 1,5) - Ponto médio: soma dos extremos da classe ÷ 2 -N º de classes: K = 1+ 3,222 log n (em geral: 5-20) no exemplo: K = 1 + 3,222 log 100 = 7,444 (7 ou 8 classes) Medidas de Tendência Central Valor de ponto em torno do qual os dados se distribuem Variância e Desvio Padrão Avalia o grau de dispersão, quanto cada dado se desvia em relação a média Média aritmética Soma dos dados ÷ nº deles Peso ao nascer em Kg de 10 RN 2,5 2,0 3,0 4,0 3,0 1,0 1,5 - 3,5 1,5 2,5 - Medidas de Tendência Central Média Aritmética Cálculo da média de dados em Tabela de Distribuição de Frequência Classe Ponto Médio Freqüência 1,5Ι— 2,0 1,75 3 2,0Ι— 2,5 2,25 16 2,5Ι— 3,0 2,75 31 3,0Ι— 3,5 3,25 34 3,5Ι— 4,0 3,75 11 4,0 Ι— 4,5 4,25 4 4,5Ι— 5,0 4,75 1 Apresentam-se os valores absolutos e as porcentagens Podem ser usadas tabelas ou gráficos DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS Gráfico de Barras Gráfico Circular DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS Gráfico de Linhas (não é usado; restrito a dados contínuos) Gráfico de Barras Horizontal Trazem informações que expressam a tendência central e a dispersão dos dados. Tendência Central: Média ( x ), Mediana ( Md ), Moda ( Mo ) Medidas de Dispersão: Desvio Padrão, Variância, Amplitude, Coeficiente de Variação, Valor Máximo, Valor Mínimo DESCRIÇÃO DOS DADOS CONTÍNUOS 30/08/2016 9 Idéia de onde se localiza o centro, o ponto médio de um determinado conjunto de dados. Medidas: Média, Moda e Mediana. MEDIDAS DE TENDÊNCIA CENTRAL f x É um valor típico representativo de um conjunto de dados. Fisicamente representa o ponto de equilíbrio da distribuição. Modos de calcular 1) para dados simples 2) para valores distintos 3) para agrupamentos em classes MÉDIA x = Σ x / n x = Σ fx / n x = Σ fx / n 1) Cálculo para dados simples MÉDIA x = Σ x / n Σ x = Soma dos valores n = tamanho da amostra x = (16+18+23+21+17+16+19+20) 8 x = 18,75 16 18 23 21 17 16 19 20 2) Cálculo para valores distintos x f 2 3 3 3 4 4 5 9 6 6 7 2 8 1 Total 28 MÉDIA x = Σ fx / n Σ fx = Soma dos produtos dos valores distintos com a frequência n = tamanho da amostra x = 134 x = 4,7857 28 3) Cálculo para agrupamentos em classes Classes f x 39 50 4 44,5 50 61 5 55,5 61 72 5 66,5 72 83 6 77,5 83 94 5 88,5 Total 25 - MÉDIA x = Σ fx / n Σ fx = Soma dos produtos dos valores distintos com a frequência n = tamanho da amostra x = 1695,5 x = 67,82 25 É o valor que ocupa a posição central de um conjunto de dados ordenados. Para um número par de termos a mediana é obtida através da média aritmética dos dois valores intermediários. Interpretação: 50% dos valores estão abaixo ou coincidem com a mediana e 50% estão acima ou coincidem com a mediana. MEDIANA 30/08/2016 10 1) Cálculoda posição da mediana para dados simples MEDIANA 2 3 4 5 6 7 8 9 10 PMd =(n+1) / 2 PMd = (9+1) / 2 PMd = 5o Termo Mediana (Md) = 6 2) Cálculo da posição da mediana para valores distintos x f fa 2 3 3o 3 3 6o 4 4 10o 5 9 19o 6 6 25o 7 2 27o 8 1 28o Total 28 - MEDIANA PMd =(n+1) / 2 PMd = (28+1) / 2 PMd = 14,5 x entre 14o e 15o Termo Mediana (Md) = 5 3) Cálculo da PMd para agrupamentos em classes Classes f x fa 39 50 4 44,5 4o 50 61 5 55,5 9o 61 72 5 66,5 14o 72 83 6 77,5 20o 83 94 5 88,5 25o Total 25 - - MEDIANA PMd =(n+1) / 2 PMd = (25+1) / 2 PMd = 13o Termo Classe Mediana 61 72 Mediana (Md) = 66,5 (estimativa) É o valor que ocorre com maior frequência em um conjunto de dados. Símbolo = Mo MODA 1) Moda para dados simples Exemplos: 2, 3, 4, 5, 6, 7, 8 AMODAL 2, 3, 3, 4, 5, 6 ,7 MODA = 3 2, 3, 3, 4, 5, 5, 6 BIMODAL (Mo = 3 e Mo = 5) 2) Moda para valores distintos x f 2 3 3 3 4 4 5 9 6 6 7 2 8 1 Total 28 MODA O valor 5 tem o maior número de ocorrências (9) Mo = 5 3) Moda para agrupamentos em classes Classes f x fa 39 50 4 44,5 4o 50 61 5 55,5 9o 61 72 5 66,5 14o 72 83 6 77,5 20o 83 94 5 88,5 25o Total 25 - - MODA Moda Bruta Ponto médio da classe de maior frequência Mo = 77,5 É uma estimativa 30/08/2016 11 MÉDIA: Dados Numéricos e Intervalares É a medida mais utilizada. MODA: Dados Nominais MEDIANA: Dados Ordinais USO DAS MEDIDAS DE TENDÊNCIA CENTRAL Determine a média, a mediana e a moda para o seguinte conjunto de dados 6 5 8 4 7 6 9 7 3 Determine o menor valor, o maior valor, a média, a mediana e a moda para o seguinte conjunto de dados 12 32 54 17 82 99 51 11 44 22 22 33 44 52 76 41 37 10 5 87
Compartilhar