Prévia do material em texto
ESTATÍSTICA EM SAÚDE Docente: Nila Mara Smith Galvão Aula 7 – Noções de Inferência Estatística Introdução aos Testes de Hipótese UNIVERSIDADE DO ESTADO DA BAHIA DEPARTAMENTO DE CIÊNCIAS DA VIDA DEPARTAMENTO DE CIÊNCIAS EXATAS E DA TERRA INFERÊNCIA PARAMÉTRICA INFERÊNCIA PARAMÉTRICA ASPECTOS GERAIS DOS TESTES DE HIPÓTESES NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTES DE HIPÓTESES Testes de hipóteses ou testes de significância estatística são métodos que utilizam dados para sumarizar evidência sobre uma hipótese (afirmação, conjectura), e estão baseados em distribuições de probabilidades. NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTES DE HIPÓTESES Considere os seguintes exemplos: a) Queremos testar a hipótese de que a altura média de indivíduos de uma certa população é de 160 cm. Numa amostra aleatória de 45 pessoas observou-se uma altura média de 170 cm com desvio-padrão de 10 cm. Estes resultados amostrais apoiam ou não a hipótese de que a altura média da população é igual a 160cm? b) Fisch et al. (1987) publicaram o primeiro relato de um ensaio clínico que avaliou a eficácia de zidovudina (AZT) para prolongar a vida de pacientes com AIDS. Os dados centrais do trabalho estão na tabela abaixo: A proporção de sobreviventes após 24 semanas de tratamento foi de 0,993 entre os pacientes que receberam o AZT e 0,883 para o grupo placebo, o que parece indicar a eficácia do AZT. Mas... será que este resultado ocorreu por mero acaso ou por ser o AZT de fato uma droga efetiva? NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTES DE HIPÓTESES Como realizar e interpretar um teste de hipótese? Inicialmente, vamos alinhar alguns conceitos e ideias importantes: O teste estatístico depende do tipo de variável e do tipo de planejamento do estudo. Qual o objetivo da análise? A variável/característica em análise é qualitativa ou quantitativa? Os dados foram obtidos de forma independente ou pareada? Deve-se seguir um procedimento estatístico, com as seguintes etapas: 1. Formular as hipóteses básicas do teste: nula e alternativa H0 Hipótese nula (igualdade; inexistência de efeito) H1 Hipótese alternativa (desigualdade; existência efeito) NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTES DE HIPÓTESES OMI: No procedimento estatístico para testes de hipóteses assume-se que H0 é verdadeira até que se encontre fortes evidências para rejeitar esta hipótese (“inocência até que se prove o contrário”). 2. Estabelecer uma regra ou critério de decisão para que H0 seja julgada (regiões de rejeição e não rejeição). O critério de decisão é baseado em uma estatística de teste. Uma estatística de teste mede a discrepância entre o que foi observado na amostra e o que seria esperado se a hipótese nula fosse verdadeira (sob H0). É razoável rejeitar a hipótese nula se o valor da estatística de teste é "grande". Como avaliar? Esse valor deve ser comparado a um valor crítico em uma distribuição de probabilidade. Uma “grande distância” avaliada pela distribuição de probabilidade é indicação de que H0 não é verdadeira, e deve portanto ser rejeitada (decisão sempre é sobre H0). NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTES DE HIPÓTESE Exemplo: ... testar a hipótese de que a altura média de indivíduos de uma certa população é de 160 cm; n = 45, altura média de 170 cm, com desvio- padrão de 10 cm. H0 : μ = 160 (μ0) n=45: X = 170 ; s = 10. H1 : μ = 160 Considere a estatística de teste Z= (X - μ0)/ (σ/√n) Para n grande (n>30) e supondo H0 verdadeira, temos que: X tem distribuição Normal com média μ0 e desvio-padrão σ/√n (Teorema Central do Limite). Logo: Z tem distribuição Normal, com média 0 e desvio-padrão 1. Uma ideia então para julgar a afirmação em H0 é comparar o valor de Z com um valor crítico obtido da distribuição Normal (0,1), para isto é preciso especificar o nível de significância do teste. Note que a estatística de teste é baseada nos dados da amostra e na hipótese nula NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTES DE HIPÓTESE O nível de significância corresponde à probabilidade de cometer um tipo de erro específico, chamado erro tipo I, que ocorre quando rejeitamos a hipótese nula, mas ela é, de fato, verdadeira. (Qto vc admite errar?) Para compreender melhor os tipos de erros relacionados a um teste estatístico de hipótese, considere a seguinte tabela: P(erro tipo I) = P(rejeitar H0/H0 é verdadeira) = α nível de significância (usualmente 5%, 1%, 0,1%) P(erro tipo II) = P(não rejeitar H0/H0 é falsa) = β 1- β poder do teste (capacidade do teste em detectar que a hipótese nula é falsa). α e β devem ser fixados no planejamento do estudo. NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTES DE HIPÓTESE Na prática, para o critério de decisão do teste estatístico, utilizamos como referência o valor α, ou seja, o nível de significância do teste. Por exemplo, estabelecido α e sabendo-se que a estatística de teste tem distribuição de probabilidade normal padrão, podemos definir a seguinte regra de decisão: Se |Z| < zα/2 , não rejeitamos H0 Se |Z| ≥ zα/2 , rejeitamos H0 (em favor de H1) Região de rejeição Região de rejeição Região de não rejeição NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTES DE HIPÓTESE No nosso exemplo, para α=5%, teremos: H0 : μ = 160 (μ0) n=45: X = 170 ; s = 10. H1 : μ ≠ 160 Z= (X - μ0)/ (s/√n) = (170 – 160)/(10/ √45) = 10/1,49 = 6,71 Agora vamos avaliar se este valor cai na região de rejeição ou não rejeição, definidas a partir da distribuição normal padrão, para o nível de significância fixado: z0,025 = 1,96 Como Z = 6,71 > 1,96, rejeita- se H0, ou seja, conclui-se que a altura média da população é diferente de 160 cm. (Teste Z para uma amostra) Note que não conhecemos σ, então vamos utilizar s para obter o valor de Z α/2 = 0,025 α/2 = 0,025 NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTES DE HIPÓTESE Assim, de modo geral, vamos comparar o valor da estatística de teste com o valor crítico da distribuição de probabilidade que descreve o comportamento da referida estatística. Considere o exemplo anterior, mas supondo um tamanho amostral n=25 (n<30). H0 : μ = 160 (μ0) n=25: X = 165 ; s = 10. H1 : μ ≠ 160 Seja T= (X - μ0)/ (s/√n) a estatística do teste. Como n é relativamente pequeno, para realizarmos o teste da hipótese especificada, os dados devem ter distribuição aproximadamente normal ou simétrica. Além disso, ao substituirmos σ por s para obter T, geramos um erro que deve ser corrigido fazendo-se um ajuste na distribuição de probabilidade de referência. Neste caso, T terá distribuição t-Student com n-1 graus de liberdade. NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTES DE HIPÓTESE Por exemplo, estabelecido α = 5% e uma estatística de teste com distribuição de probabilidade t-Student com gl = 24, podemos definir a seguinte regra de decisão: Se |T| < tα/2,n-1 , não rejeitamos H0 Se |T| ≥ tα/2,n-1 , rejeitamos H0 T= (X - μ0)/ (s/√n) = (165 – 160)/(10/√25) = 5/2 = 2,5 Como T=2,5 > 2,064, rejeitamos H0. t0,05/2;24 = 2,064 α/2 NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTES DE HIPÓTESE Uma forma equivalente de estruturar a regra de decisão na condução de um teste de hipótese é comparar: a probabilidade de se observar um valor igual ou superior àquele obtido pela estatística de teste (p-valor) com o nível de significância fixadopara o teste. Esta é uma prática muito usual. Qual a ideia? (teste bilateral) tα/2; n-1 - tα/2; n-1 α/2 α/2 T -T p-valor Quanto menor o p-valor, maior a evidência para se rejeitar H0. NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTES DE HIPÓTESE Vimos que, como T = 2,5 > 2,064, rejeitamos H0. De modo equivalente, como p-valor ≈ 0,02 < α = 0,05, concluímos que os dados amostrais trazem evidência suficiente para rejeitarmos H0, ao nível de significância de 5%. No exemplo para a estatura média de indivíduos, temos: NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTES DE HIPÓTESE Resumindo o procedimento: 1) Definir as hipóteses básicas do teste (quais as afirmações, conjecturas envolvidas; qual a hipótese nula, i.e., o que está sendo testado?) 2) Calcular a estatística de teste (dados amostrais, sob H0; distribuição de probabilidade) 3) Decidir pela rejeição ou não da hipótese nula, comparando a estatística de teste com um valor crítico na distribuição de probabilidade de referência, ou comparando o p-valor (nível descritivo) do teste com o nível de confiança previamente fixado. OMI: diferentes testes para diferentes objetivos, diferentes tipos de variáveis e diferentes estruturas dos dados. NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTE QUI-QUADRADO DE INDEPENDÊNCIA Teste Qui-quadrado: Procedimento estatístico mais comumente utilizado para testar a hipótese nula de independência entre duas variáveis categóricas (nominais ou ordinais): Ho: Não existe associação entre Variável 1 e Variável 2 (independência entre os fatores) H1: Existe associação entre Variável 1 e Variável 2. Estatística de teste (de Pearson) (tabela de contingências IxJ ): Aproximadamente, esta estatística segue uma distribuição de probabilidade qui-quadrado com (I-1)(J -1) graus de liberdade. NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTE QUI-QUADRADO DE INDEPENDÊNCIA Exemplo: será que este resultado ocorreu por mero acaso ou por ser o AZT de fato uma droga efetiva? Como o valor crítico na distribuição qui-quadrado com gl=1 (α= 5%) é igual a 3,84, rejeitamos Ho, concluindo que o AZT se mostrou uma droga efetiva. H0: não existe associação entre AZT e sobrevivência em indivíduos com AIDS H1: há associação entre AZT e sobrevivência em indivíduos com AIDS De modo equivalente (2x2): H0: vivos,AZT = vivos,placebo H1: vivos,AZT = vivos,placebo NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTES QUI-QUADRADO DE INDEPENDÊNCIA Na literatura científica: NOÇÕES DE INFERÊNCIA ESTATÍSTICA TESTE QUI-QUADRADO DE INDEPENDÊNCIA No STATA: REFERÊNCIAS AMORIM, L. D. A. F. Material de aula. Atividades. Componente de Bioestatística. 2017. Doutorado em Saúde Pública, Instituto de Saúde Coletiva, Universidade Federal da Bahia. BACURAU A.G.M.; FRANCISCO P.M.S.B. Prevalência de vacinação contra a influenza em idosos brasileiros com doenças crônicas. Cad. Saúde Pública 2019; 35(4):e00230518. MIOT, H. A. Avaliação da normalidade dos dados em estudos clínicos e experimentais. J Vasc Bras. 2017 Apr.- Jun.; 16(2):88-91. Disponível em https://www.scielo.br/j/jvb/a/FPW5hwZ6DTH4gvj5mJYpt6B/?lang=pt&format=pdf SOARES, J. F.; SIQUEIRA, A. L. INTRODUÇÃO À ESTATÍSTICA MÉDICA.. Belo Horizonte, UFMG: Coopmed Editora Médica. 1999. 300p. SHIMAKURA, S. (2010). Apostila da disciplina CE055 - Bioestatística A. Universidade Federal do Paraná: Laboratório de Estatística e Geoinformação – LEG. Disponível em: http://www.leg.ufpr.br/~silvia/CE055/ce055.pdf (texto) e http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf (slides). ZANETTA, D. M. T. Conceitos básicos de Inferência Estatística. Disponível em https://midia.atp.usp.br/plc/plc0503/impressos/plc0503_02.pdf https://www.ime.unicamp.br/~hlachos/Inferencia.pdf http://www.leg.ufpr.br/~silvia/CE055/ce055.pdf http://www.leg.ufpr.br/~silvia/CE055/ce055.pdf http://www.leg.ufpr.br/~silvia/CE055/ce055.pdf http://www.leg.ufpr.br/~silvia/CE055/ce055.pdf http://www.leg.ufpr.br/~silvia/CE055/ce055.pdf http://www.leg.ufpr.br/~silvia/CE055/ce055.pdf http://www.leg.ufpr.br/~silvia/CE055/ce055.pdf http://www.leg.ufpr.br/~silvia/CE055/ce055.pdf http://www.leg.ufpr.br/~silvia/CE055/ce055.pdf http://www.leg.ufpr.br/~silvia/CE055/ce055.pdf http://www.leg.ufpr.br/~silvia/CE055/ce055.pdf http://www.leg.ufpr.br/~silvia/CE055/ce055.pdf http://www.leg.ufpr.br/~silvia/CE055/ce055.pdf http://www.leg.ufpr.br/~silvia/CE055/ce055.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf http://www.leg.ufpr.br/lib/exe/fetch.php/disciplinas:ce055:estatistica.pdf