Prévia do material em texto
14/08/17 1 Prof. Dr. Alan Moraes. moraes@univali.br � Univariada (Descritiva) ¡ Cada variável é tratada isoladamente mediante exploração detalhada das observações. � Bivariada (Inferencial/Analítica) ¡ Relacionamento entre duas variáveis. � Multivariada ¡ Relação simultânea entre mais de duas variáveis. A análise bivariada explora a relação entre variáveis, que não é possível ser vista na análise univariada. Esta etapa é importante, pois possibilita o levantamento de hipóteses que serão testadas com testes específicos. � Hipótese nula ¡ H0 = afirmação conservadora sobre uma situação de pesquisa � Hipótese alternativa ¡ H1 = Formulada como alternativa para H0 H0 = gasto energético é o mesmo entre homens e mulheres H1 = gasto energético é diferente entre homens e mulheres 14/08/17 2 � A utilização de dados de uma amostra para fazer inferências válidas para toda a população tem que considerar a possibilidade do acaso ou erro amostral. � Dois tipos de erros devem ser considerados ¡ Erro tipo I, ou probabilidade α. ¢ Probabilidade de se rejeitar a hipótese nula, sendo ela verdadeira. ¡ Erro tipo II ou β ¢ Probabilidade de não se rejeitar a hipótese nula, sendo ela falsa Funções dos testes estatísticos: �Descartar o acaso como uma possível explicação para o resultado observado; �Tem como resultado um número representando a probabilidade desse acaso, chamado valor de p. � Para a interpretação adequada dessa probabilidade é sempre necessária uma perfeita identificação da hipótese que está sob teste (a H0). � Valores de p pequenos indicam que é pouco provável que a associação tenha ocorrido ao acaso, sugerindo a rejeição da H0. � A associação entre exposição e desfecho: é condição necessária para estabelecer a relação de causa e efeito. � Embora ser estatisticamente significativo seja condição necessária para a relação, não é suficiente, visto que devem ser descartados vieses e fatores de confusão; 14/08/17 3 � Teste estatístico responde se a associação entre as variáveis foi ao acaso ou não. � A quantificação da associação é dada pelas medidas de associação e seus respectivos intervalos de confiança (IC95%) Curva Gaussiana 14/08/17 4 � Kolmogorov-Smirnov � Shapiro-Wilk ¡ Partem da hipótese de que os dados não seguem uma distribuição normal ¡ Valor de p deve ser >0,05 para ser considerada distribuição normal ¡ IMPORTANTE: Variáveis qualitativas serão tratadas como NÃO-PARAMÉTRICAS! � Kolmogorov-Smirnov (≥ 50 amostras) � Shapiro-Wilk (< 50 amostras) NORMAL OU NÃO-NORMAL? � A distribuição normal/paramétrica tem como parâmetros a média e o desvio-padrão. � A curva normal tem forma de sino. � Testes paramétricos ¡ Baseiam nos parâmetros desta distribuição normal (ou gaussiana) e o nível intervalar de mensuração das variáveis. 14/08/17 5 � Testes não paramétricos ¡ Tem por base as frequências/contagens. � Distribuição livre ¡ Teste de U de Mann-Whitney ¡ Kruskal-Wallis ü Relação entre variáveis numéricas ü Relação entre duas variáveis categóricas ü Relação entre uma variável categórica e uma numérica 14/08/17 6 � A análise inicial realizada por gráficos ¡ mostrar a relação entre elas, como dispersão das observações em torno da um padrão médio ¢ gráfico de dispersão ¡ Observar tendência de variação conjunta das variáveis ¢ Com aumento de uma das variáveis, há aumento (relação direta) ou redução da outra (relação inversa) � A análise inicial realizada por gráficos ¡ Observar tendência de variação conjunta das variáveis � A análise inicial realizada por gráficos ¡ Observar tendência de variação conjunta das variáveis � A análise inicial realizada por gráficos ¡ Observar tendência de variação conjunta das variáveis Correlação + Correlação - Sem correlação 14/08/17 7 Análise do grau de relacionamento entre duas variáveis quantitativas (discretas ou contínuas) Correlação Exemplo: Idade (anos) X Anos de estudo (anos) de Pearson (r)àassume normalidade dos dados de Spearman (rho)ànão assume normalidade dos dados � Pela análise inicial realizada no gráfico de dispersão, parece haver uma correlação negativa. Agora aplica-se o Teste de Correlação de Pearson. ¡ Observar tendência de variação conjunta das variáveis �Análise de regressão e/ou correlação ¡ Regressão linear simples ¢Função matemática para descrever a variável dependente em função da independente ¢Coeficiente angular � inclinação da reta de regressão ¢Coeficiente linear � valor de Y quando X é igual a 0 � Análise de regressão e/ou correlação ¡ Coeficiente de correlação de Pearson ¢ Quantificar o grau de relacionamento linear entre duas variáveis numéricas ¢ Varia de -1 a 1 ¢ 0 é sem correlação ¡ Coeficiente de determinação, R2 ¢ Quadrado do coeficiente de correlação de Pearson ¢ Indica quanto que a variabilidade de uma variável é explicada pela incorporação da outra variável 14/08/17 8 ¡ Coeficiente de determinação, R2 ¢ Quadrado do coeficiente de correlação de Pearson (Indica quanto que a variabilidade de uma variável é explicada pela incorporação da outra variável) R2 = 0,057 x 100= 5,7% ¡ Coeficiente de determinação, R2 ¢ Conclusão: O aumento da Idade explica apenas 5,7% da redução da quantidade de anos estudados. R2 = 0,057 x 100= 5,7% � Utilizar um teste não-paramétrico � Tabela de frequência ¡ Distribuição das informações das categorias de uma variável pela categoria da outra � Duas variáveis dicotômicas ¡ Tabela de contingência (ou 2 x 2) ¢ Exposição (linhas) ¢ Desfecho (colunas) 14/08/17 9 � Teste estatístico clássico ¡ Teste qui-quadrado (c2) ¢ Comparação das frequências observadas com as frequências esperadas ¢ Se a hipótese nula fosse verdadeira (proporções iguais) ¢ Requisitos � Comparação entre duas ou mais categorias � Dados pertencentes a mensuração nominal � Amostragem aleatória � Frequências esperadas por casela não muito pequenas (5 ou mais) ou totalizando mais de 30 ¡ Exemplo: � Existe associação entre obesidade e ter HAS? � Estudo observacional transversal; � Amostra: 1669 indivíduos adultos, residentes em Florianópolis/SC, ano de 2012 (Dados do Vigitel); � Teste c2 para verificar se existem diferenças entre os grupos e se ela não ocorreu ao acaso. ¡ Exemplo: ¡ Exemplo: 14/08/17 10 ¡ Exemplo: Utilizo x² à valor de p<0,05 ou p=0,000 Estudo transversal Razão de Prevalência Estudo de coorte Razão de Incidência Estudo caso- controle Razão de Chances A interpretação da medida de associação necessariamente vem acompanhada por seu IC95%. � RP > 1: a prevalência nos expostos é maior se comparada aos não expostos; � RP < 1: a prevalência nos expostos é menor se comparada aos não expostos; � RP = 1: a prevalência nos expostos não difere da dos não expostos. � RR>1 : a exposição aumenta o risco de ocorrência do desfecho � RR < 1: a exposição diminui o risco de ocorrência do desfecho � RR = 1: não existe associação entre a exposição e a ocorrência do desfecho 14/08/17 11 � OR > 1: a exposição aumenta a chance/risco de ocorrência do desfecho � OR < 1: a exposição diminui a chance/risco de ocorrência do desfecho � OR = 1: não existe associação entre a exposição e a ocorrência do desfecho ¡ Exemplo: Tabela 2x2 � Obesidade associada a HAS � Obesidade associada a HAS 14/08/17 12 � RP > 1: a prevalência nos expostos é maior se comparada aos não expostos; � RP < 1: a prevalência nos expostos é menor se comparada aos não expostos; � RP = 1: a prevalência nos expostos não difere da dos não expostos. � Teste paramétrico t de Student ¡ Compara médias de uma variável numérica (divididas em dois grupos) com variável categórica dicotômica ¢ Preciso transformar a variável numérica em uma categórica dicotômica ¡ A hipótese nula é a de igualdade entre as variáveis � Teste não-paramétrico U Mann-Whitney ¡ Variável numérica não apresenta distribuição normal ou não há homogeneidade das variâncias�Alternativa quando se dispõe de amostra pequena 14/08/17 13 � Exemplo: Existe diferença entre média de idade e ter ou não hipertensão arterial sistêmica? ¡ Variável numérica: Idade, divida entre ≤50 (1) e >50 anos (2) – verificada anteriormente como Não-Paramétrica ¡ Variável qualitativa nominal dicotômica: ter ou não hipertensão ¡ A hipótese nula a de igualdade entre as variáveis ¡ Objetivo do teste: Rejeitar a hipótese nula Utilizo Valor de p>0,05 ou p<0,001 ou p=0,000 Teste não-paramétrico para dados pré e pós Anteriormente, verificamos se havia diferença estatística, mas existe associação? RP= 1,66 (1,55-1,79) A prevalência de hipertensos é 66% maior entre os com idade superior a 50 anos Portanto, idade >50 é fator de risco 14/08/17 14 � Seguem as normas da ABNT RP