Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIDADE 6: CONCEITOS BÁSICOS DE INFERÊNCIA ESTATÍSTICA UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO CENTRO DE CIÊNCIAS DA SAÚDE Professora: MONICA CATTAFESTA 2017 DELINEAMENTOS DE PESQUISA UNIDADE 6: CONCEITOS BÁSICOS DE INFERÊNCIA ESTATÍSTICA Classificação dos delineamentos de pesquisa em ciências biomédicas Estudos observacionais: Estudos de casos/ série de casos Estudo transversal / de prevalência / ecológico Estudo de coorte / de incidência Estudo de caso/controle Estudos experimentais: Experimento laboratorial Ensaio clínico ESTUDOS OBSERVACIONAIS Estudo de casos: Relato das características mais importantes observadas em um grupo com uma determinada condição clínica; Essencialmente para condições clínicas para as quais ainda há escassas informações; Número reduzido de pacientes; Sem grupo controle; Vantagem: condução relativamente fácil e importante para geração de hipóteses; Desvantagem: não representar necessariamente o padrão daquela condição e não conclusivo. ESTUDOS OBSERVACIONAIS Estudo transversal: O desfecho e a exposição são avaliados simultaneamente em um grupo de indivíduos “fotografia”; Causalidade reversa: quando é plausível supor que o desfecho pode provocar alterações na exposição e vice-versa. Ex.: relação entre assédio sexual e alcoolismo; Viés de sobrevivência: prevalência é uma mistura da força de ocorrência de casos novos na população e da duração da doença. Ex.: novo medicamento que promove redução da duração da doença. A diminuição da prevalência não foi devido a nenhum preditor associado. ESTUDOS OBSERVACIONAIS Estudo transversal: Medidas: Prevalência (e não casos incidentes); razão de prevalência (Odds ratio - razão de chance e Poisson); Vantagem: fácil condução; rápido; menor custo; geradores de hipóteses; primeira estratégia de investigação analítica; Desvantagem: potencial para viés de seleção; não permite esclarecer se a exposição precedeu o desfecho ou foi determinada por ele (causalidade reversa); viés de sobrevivência. ESTUDOS OBSERVACIONAIS Estudo ecológicos: Utilidade limitada à descrição dos fenômenos e, no máximo, à geração de hipóteses que, necessariamente, deveriam ser posteriormente testadas no nível individual; Falácia ecológica: Impossibilidade de seus resultados serem extrapolados para indivíduos, em face da não equivalência entre as medidas de associação resultantes de suas análises e as correspondentes de nível individual; Medidas: médias ou proporções que caracterizam o grupo e não o indivíduo e características dos locais em que cada grupo possui. ESTUDOS OBSERVACIONAIS Estudo caso-controle: O início dá-se a partir do desfecho e investigam-se exposições que ocorreram no passado RETROSPECTIVO; Tentativa de identificar as características (fatores de risco) que estejam mais presentes nos casos (desfecho presente) do que nos controles (desfecho ausente); Controles: indivíduos com as mesmas características que não possuem o desfecho; obtidos a partir da população que deu origem aos casos PAREAMENTO; Exposição anterior tempo de latência desfecho ESTUDOS OBSERVACIONAIS Estudo caso-controle: Medida: Odds ratio (OR) ou razão de chances; Vantagem: úteis no estudo de doenças ou desfechos raros ou que envolvem um longo período de latência; relativo baixo custo; Desvantagem: potencial para viés de seleção e a avaliação da exposição também é propensa a ocorrência de distorções. ESTUDOS OBSERVACIONAIS Estudos de coorte: Seguimento de um grupo de sujeitos que são comparados em subgrupos de expostos (mais) e não-expostos (menos) quanto à ocorrência de um ou mais desfechos de interesse PROSPECTIVO; Os indivíduos devem estar livres do desfecho no momento inicial; Grupos com exposição especial: altos níveis de exposição a uma substância particular; pessoas infectadas com um agente; pessoas com alguma anormalidade em qualquer medida; Grupos com características comuns: médicos, grupos de seguros de vida, grupos obstétricos, voluntários, veteranos de guerra, universitários; Grupos geograficamente definidos: Framingham; Hiroshima; Pelotas. ESTUDOS OBSERVACIONAIS Estudos de coorte: Medidas: Risco absoluto: indica a probabilidade de um membro do grupo ser acometido por um dado agravo, em um período especificado; Risco relativo: é uma razão entre dois coeficientes de incidência (coeficiente de incidência nos expostos e coeficiente de incidência nos não-expostos); Risco atribuível: excesso de incidência da doença relacionada à exposição; mede o efeito absoluto da exposição. Vantagem: proporcionam o seguimento de indivíduos com exposições raras; excelente para testar hipóteses; Desvantagem: custo elevado; demorada execução; perdas de seguimento podem levar a vício de seleção. ESTUDOS EXPERIMENTAIS Experimento laboratorial e ensaio clínico: Estudo de coorte cuja exposição é determinada pelo investigador PROSPECTIVO; Envolvem tentativa de mudar os determinantes de uma doença, tais como uma exposição ou comportamento, ou cessar o progresso de uma doença por meio de um tratamento; Experimento: controlada em material de laboratório ou animais de experimentação; Ensaio: seres humanos; ESTUDOS EXPERIMENTAIS Experimento laboratorial e ensaio clínico: Randomizados: pacientes são alocados de forma aleatória; Controlados: grupo controle; Duplo-cegos: nem o paciente, nem o profissional deverão ter conhecimento do grupo ao qual o paciente pertence (intervenção ou controle) Efeito Placebo e influência do pesquisador; Vantagens: não devem ser influenciados por variáveis de confusão; permitem estudar a história natural da doença; Desvantagens: podem ser muito caros; podem não ser generalizáveis; podem ser eticamente inaceitáveis; muitos pacientes podem desistir do tratamento. ESTUDOS EXPERIMENTAIS Experimento laboratorial e ensaio clínico: TIPO OPERATIVO POSIÇÃO DO INVESTIGADOR REFERÊNCIA TEMPORAL DENOMINAÇÕES CORRENTES AGREGADO OBSERVACIONAL TRANSVERSAL ESTUDOS ECOLÓGICOS LONGITUDINAL ESTUDOS DE TENDÊNCIA OU SÉRIES TEMPORAIS INTERVENÇÃO LONGITUDINAL ENSAIOS COMUNITÁRIOS INDIVIDUADO OBSERVACIONAL TRANSVERSAL INQUÉRITOS OU SURVEYS LONGITUDINAL PROSPECTIVOS (COORTES) RETROSPECTIVOS (CASO- CONTROLES) INTERVENÇÃO LONGITUDINAL ENSAIOS CLÍNICOS ESTUDOS EXPERIMENTAIS Almeida Filho; Barreto, 2013 DISTRIBUIÇÃO NORMAL UNIDADE 6: CONCEITOS BÁSICOS DE INFERÊNCIA ESTATÍSTICA DESCRIÇÃO DA CURVA NORMAL Distribuição normal de probabilidade, simetria, paramétrico; GRÁFICO: curva em forma de sino, simétrica em relação ao ponto de frequência máxima (média) Curva de distribuição normal OU Curva de Gauss; Representa a distribuição de frequências da amostra, admitindo-se que o intervalo da classe seja cada vez menor à medida que aumenta o tamanho da amostra; Vários testes estatísticos que serão examinados adiante, pressupõem que os dados sejam provenientes de uma distribuição normal; Representa a distribuição de frequências da população As extremidades da curva, em ambos os lados da média, se estendem cada vez mais próximas da linha de base sem jamais tocá-las (caudas assintóticas) Curva simétrica em relação à média - ∞ + ∞ 50% 50% 100% Regra empírica: ~ 68% das observações estão entre x ± 1 DP (μ ± σ); ~ 95% das observações estão entre x ± 2 DP (μ ± 2σ); ~ 99% das observações estão entre x ± 3 DP (μ ± 3σ). “Diz-se que uma observação, tirada ao acaso de uma população normal, tem uma probabilidade igual a 0,95 (95%) de estarcontida no intervalo μ ± 2σ, ou, que tem uma probabilidade igual a 0,05 (5%) de que seu valor esteja fora desse intervalo”. Ex.: Glicemia: μ = 87 e σ = 9,1 mg/dL 87 mg/dL + 1 σ- 1 σ 77,9 mg/dL 96,1 mg/dL + 1 σ 105,2 mg/dL - 1 σ 68,8 mg/dL Há uma curva para cada valor atribuído de μ e σ: CURVA NORMAL PADRONIZADA Distribuição normal padronizada OU distribuição normal reduzida: μ = 0 σ = 1 Resultado desta transformação: obtenção de uma nova variável (denominada z) que mede o afastamento do valor de x em relação a média, em número de desvios padrão ESCORE Z. CURVA NORMAL PADRONIZADA ESCORE Z: = x – μ σ Z = afastamento dos valores de x em relação à média em número de desvios padrão x = valor qualquer da variável aleatória μ = média da distribuição σ = desvio padrão da distribuição 68,2% das observações estão entre x ± 1 DP (μ ± σ); 95% das observações estão entre x ± 2 DP (μ ± 2σ); 100% das observações estão entre x ± 3 DP (μ ± 3σ). 34,1%34,1% 13,4% 13,4% 2,5%2,5% VALORES DA TABELA Z Os valores da distribuição normal padronizada, referente à área acumulada para diferentes valores de Z encontram-se em tabelas, não havendo necessidade de serem calculados; Pode-se obter qualquer área sob a curva normal padronizada, entre cada ponto do eixo horizontal e a média; 50% da área se encontram de cada lado da média; Áreas sob a curva normal padronizada Para os valores negativos de z as áreas são obtidas por simetria Áreas sob a curva normal padronizada Para os valores negativos de z as áreas são obtidas por simetria Ex.: Z = 1,55 ↓ 0,4394 ↓ 43,94% da área limitada pela curva Áreas sob a curva normal padronizada Para os valores negativos de z as áreas são obtidas por simetria Ex.: Z = 1,96 ↓ 0,4750 ↓ 47,5% da área limitada pela curva ↓ x 2 = 95% da área total 95% dos valores de uma variável em distribuição normal estão entre o intervalo μ ± 1,96σ, enquanto 5% ficarão fora deste intervalo Alguns intervalos e áreas correspondentes na curva normal Percentagens de medidas na população normal Intervalo 50% μ ± 0,67σ 68,3% μ ± 1σ 95% μ ± 1,96σ 99% μ ± 2,58σ 99,7% μ ± 3σ 99,9% μ ± 3,29σ Ex.: Em uma distribuição de valores de glicose de homens entre 30 e 39 anos, a média observada foi de μ = 100 mg/dL e o σ = 15 mg/dL. O z correspondente a x = 120. Qual a proporção de pessoas com glicose entre 100 e 120 mg/dL? = x – μ σ = 120 – 100 15 = 1,33 Áreas sob a curva normal padronizada Para os valores negativos de z as áreas são obtidas por simetria = 1,33 Ex.: Em uma distribuição de valores de glicose de homens entre 30 e 39 anos, a média observada foi de μ = 100 mg/dL e o σ = 15 mg/dL. O z correspondente a x = 120. Qual a proporção de pessoas com glicose entre 100 e 120 mg/dL? = x – μ σ = 120 – 100 15 = 1,33 40,82% 100 120 Qual a proporção de pessoas com glicose entre acima de 120 mg/dL? 120 40,82% 50% - 40,82% = 9,18% Qual a proporção de pessoas com glicose entre 80 e 120 mg/dL? = x – μ σ = 80 – 100 15 = - 1,33 - 40,82% = x – μ σ = 120 – 100 15 = 1,33 40,82% Áreas sob a curva normal padronizada Para os valores negativos de z as áreas são obtidas por simetria = - 1,33 Qual a proporção de pessoas com glicose entre 80 e 120 mg/dL? = x – μ σ = 80 – 100 15 = - 1,33 - 40,82% 100 12080 81,64% Qual a proporção de pessoas com glicose entre 95 e 125 mg/dL? = x – μ σ = 95 – 100 15 = - 0,33 = x – μ σ = 125 – 100 15 = 1,67 Áreas sob a curva normal padronizada Para os valores negativos de z as áreas são obtidas por simetria Qual a proporção de pessoas com glicose entre 95 e 125 mg/dL? = x – μ σ = 95 – 100 15 = - 0,33 = x – μ σ = 125 – 100 15 = 1,66 - 12,93% 45,25% Qual a proporção de pessoas com glicose entre 95 e 125 mg/dL? 100 12595 58,18% VALORES DA TABELA Z Sabendo-se como calcular áreas sob uma curva normal, torna-se fácil encontrar a proporção (probabilidade) de pessoas que apresentam certos valores de colesterol, pesos ou qualquer outra variável que está normalmente distribuída. Enfim, conhecendo-se a probabilidade de um dado evento, é possível obter inferências apropriadas como a ocorrência esperada de um evento. ELEMENTOS DE INFERÊNCIA ESTATÍSTICA UNIDADE 6: CONCEITOS BÁSICOS DE INFERÊNCIA ESTATÍSTICA INTRODUÇÃO População Amostra Inferência estatística “As conclusões baseadas em amostras estão sempre acompanhadas de incerteza”. DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS (DAM) Valores de médias de amostras diferentes obtidas de uma mesma população não são necessariamente iguais entre si. Essa variação atribuída às diferenças na composição das amostras aleatórias é dependente de erro aleatório, também conhecida como erro amostral ou variação amostral; Importante no processo de inferência estatística; Tende para uma distribuição normal. TEOREMA DO LIMITE CENTRAL Na medida em que o tamanho da amostra aumenta, a distribuição das médias amostrais tende para uma distribuição normal independente do tipo de distribuição da população; Logo, a média das médias das amostras poderá ser considerada como a média da população; Porém o desvio padrão será calculado – denominado Erro Padrão da Média: TEOREMA DO LIMITE CENTRAL Para amostras de tamanho n > 30, a distribuição das médias amostrais pode ser aproximada satisfatoriamente por uma distribuição normal; A aproximação melhora a medida em que aumenta o tamanho da amostra; Se a população tem distribuição normal, as médias amostrais terão distribuição normal para qualquer tamanho amostral n. SIGNIFICÂNCIA ESTATÍSTICA DE UM DESVIO SIGNIFICÂNCIA ESTATÍSTICA DE UM DESVIO Sequência de procedimentos para se determinar a significância de um desvio entre a média amostral (x) e a média populacional (μ): 1. Escolher inicialmente o critério ou o nível de significância desejado (Ex.: α = 0,05); 2. Obter o valor crítico de z da tabela (Ex.: zα = z 0,05 = 1,96); 3. Calcular o afastamento entre a média amostral (x) e a média populacional (μ), ou seja x - μ, em erros-padrão, usando a fórmula: Regra de decisão: Se |zcalc| < zα, o desvio é dito “não-significativo” Se |zcalc| ≥ zα, o desvio é dito “significativo” SIGNIFICÂNCIA ESTATÍSTICA DE UM DESVIO Exemplo: Pressão arterial (PA) de cinco executivos do sexo masculino, na faixa de 40 a 44 anos, escolhidos aleatoriamente, obtendo: 135; 143; 149; 128 e 158 mmHg (x = 142,6 mmHg). Na revisão de literatura, o pesquisador, verificou que, nessa população e faixa etária, a média de PA é 129 mmHg, com σ = 15 mmHg. Resolução: 1. Escolher inicialmente o critério ou o nível de significância desejado α = 0,05; 2. Obter o valor crítico de z da tabela zα = z 0,05 = 1,96; SIGNIFICÂNCIA ESTATÍSTICA DE UM DESVIO Resolução: 3. Calcular o afastamento (erros-padrão): Conclui-se que a média obtida dos 5 executivos (142,6 mmHg) desvia-se significativamente da média da população de homens na mesma faixa etária, estando mais elevada. TESTE DE HIPÓTESES HIPÓTESE ESTATÍSTICA: “Afirmação sobre o parâmetro de uma distribuição de probabilidades”; Precisa ser formulada de uma maneira que possa ser testada: TESTE DE HIPÓTESE: “Mecanismo de avaliação para verificar se uma hipótese pode ser considerada como verdadeira ou falsa”. COMO FORMULAR UM TESTE DE HIPÓTESE • HIPÓTESE NULA (H0): μ = μ0• Supõe que as médias populacionais são iguais, ou seja, as duas médias foram extraídas da mesma população; • É a hipótese a ser testada; • HIPÓTESE ALTERNATIVA (H1): μ ≠ μ0 • Supõe que as médias populacionais são diferentes, ou seja, as duas médias não foram extraídas da mesma população; • Deve ser adotada quando H0 for rejeitada. TESTE DE HIPÓTESES Exemplo: Um determinado medicamento é receitado para pacientes obesos visando potencializar a perda de peso em 10 Kg no primeiro mês com DP de 3 Kg. Um pesquisador resolve avaliar a eficácia do medicamento em 20 pacientes do seu grupo: H0: O medicamento causa a perda de 10 Kg em um mês de uso (μ = 10, pois μ = μ0); H1: O medicamento não leva à perda de 10Kg em um mês de uso (μ < 10, pois μ ≠ μ0). TESTE DE HIPÓTESES Exemplo: Supondo que H0 seja verdadeira, a média da amostra aleatória de 20 pacientes será uma variação de peso com média de 10 Kg e desvio padrão σ/√n; Sabemos que x é aproximadamente normal, então podemos calcular a probabilidade de obter-se um valor abaixo de 8 Kg: Z calc = 8 – 10 3 √20 Z calc = -2 _3_ 4,47 Z calc = – 2 0,67 Z calc = – 2, 98 Áreas sob a curva normal padronizada Para os valores negativos de z as áreas são obtidas por simetria TESTE DE HIPÓTESES Exemplo: Z calc = – 2, 98 49,86% 50,0% - 49,86% = 0,14% Existe a possibilidade de 0,0014 ou 0,14% de que, mesmo H0 sendo verdadeira, x assuma um valor na região que leva à rejeição de H0 (conforme critério adotado). REGRA DE DECISÃO • Aceitar H0: • Quando não houver evidência suficiente para duvidar de sua validade, conclui- se que μ = μ0; • Qualquer diferença encontrada foi casual e não representa uma real diferença entre as médias populacionais. • Rejeitar H0 e aceita H1: • Quando houver evidência suficiente para duvidar de sua validade, conclui-se que μ ≠ μ0 μ pode ser maior ou menor que μ0; • As diferenças encontradas é grande demais para ser explicada apenas ao acaso (erro amostral). REGRA DE DECISÃO • * A escolha entre o tipo de teste deve ser realizado ANTES da obtenção dos dados amostrais. Unicaudal ou unilateral Bicaudal ou bilateral • Avaliação de um novo medicamento para cefaleia (tempo de ação ~ 100 minutos): • H0 μ = 100 minutos • H1 μ ≠ 100 minutos para + ou - Exemplos: • Peso ao nascer de filhos de mães usuárias de drogas ilícitas: • H0 PN = • H1 PN < ERROS DE DECISÃO •Erro tipo I: Rejeitar H0 quando de fato H0 é verdadeiro. •Erro tipo II: Não rejeitamos H0 quando de fato H0 é falsa. Situação Observada Decisão H0 verdadeira H0 falsa Aceitar H0 Decisão correta Erro II Falso-negativo Rejeitar H0 Erro I Falso-positivo Decisão correta Dos 20 participantes avaliados, a x de peso perdido em um mês foi 10Kg e o pesquisador rejeitou o uso do medicamento Dos 20 participantes avaliados a x de peso perdido em um mês foi 8Kg e o pesquisador aceitou o uso do medicamento ERROS DE DECISÃO •Erro tipo I: Rejeitar H0 quando de fato H0 é verdadeiro. •Erro tipo II: Não rejeitamos H0 quando de fato H0 é falsa. ERROS DE DECISÃO •α: Quantidade máxima de erro do tipo I tolerável; •β: Limite máximo de erro do tipo II no processo de busca de diferenças significativas. •Poder do teste de hipótese = 1 – β • Probabilidade de se detectar ou rejeitar a H0; • Também influenciado por α e o tamanho amostral. PROBABILIDADES DE ERROS DE DECISÃO • Nível de significância (α): • Probabilidade máxima de cometer erro do tipo I; • α = 5% probabilidade de 0,05 de rejeitar a H0, mesmo ela sendo verdadeira (Erro do tipo I); • α = 1% probabilidade de 0,01 de rejeitar a H0, mesmo ela sendo verdadeira (Erro do tipo I); • Deve ser parte integrante do planejamento do estudo. VALOR DE P • Valor de P ou valor crítico amostral: probabilidade de se avaliar a ocorrência do erro do tipo I; • Valor calculado a partir dos dados obtidos no estudo: • P ≤ α Rejeita-se H0 e aceita H1 Há diferença entre as médias; • P > αAceita-se H0Não há diferenças entre as médias. 0 1 0,05 P < 0,05 Significativo P > 0,05 Não significativo EXECUÇÃO DO TESTE DE HIPÓTESE • Passos para o teste da H0: 1. Especificar o nível de significância (α): α 5%, α 1%... 2. Escolher o teste: adequado ao material sob investigação, ao tipo de variável e a seu nível de medida; 3. Obter o valor crítico: valores críticos descritos em tabelas; 4. Obter o valor calculado do teste: calcular mediante fórmulas ou softwares estatísticos; EXECUÇÃO DO TESTE DE HIPÓTESE • Passos para o teste da H0: 5. Comparar os valores calculados e críticos; 6. Conclusão: • Valor calculado ≥ valor crítico da tabela Rejeita-se H0 e aceita H1; • Valor calculado < valor crítico da tabelaAceita-se H0. TESTE DE HIPÓTESES: ESTATÍSTICA DO TESTE • A estatística do teste de hipótese depende da distribuição da variável na população e das informações disponíveis. Sim Dist. Normal (População) Não “Amostra Grande” Sim Não Teste z Teste t Sim Não Testes não paramétricos conhecido? SIGNIFICÂNCIA ESTATÍSTICA VS RELEVÂNCIA CIENTÍFICA • “Estatisticamente significante” ≠ “Cientificamente importante”; • Exemplo: medicamento para controle da Pressão Arterial (PA): • N = 100.000; • Medicamento reduziu a PA em 1 mmHg em hipertensos com p = 0,001. • Há relevância clínica já que foi estatisticamente significante? REFERÊNCIAS MOTTA, V. T. Bioestatística. 2. ed. Caxias do Sul: Educs, 2006. 190p. VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016. 245p. monica_cattafesta@hotmail.com
Compartilhar