Buscar

Correlação e regressão medicina - pdf

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 33 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 33 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 33 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

BIOESTATÍSTICA 
Curso de Medicina 
Correlação e Regressão 
 
 
Prof. Vinícius Silva Belo 
Correlação 
• Estudaremos agora e na estatística II a relação 
entre variáveis. 
 
• Na correlação, AS DUAS VARIÁVEIS SÃO 
CONTÍNUAS e queremos ver como elas se 
relacionam. Se houver alguma relação entre elas, 
dizemos que há uma correlação. Veremos a força 
dessa relação e mais a frente a previsão de 
valores de uma variável a partir da outra e a reta 
de regressão. 
Correlações: estudos - exemplos 
Després et al., hipotetizaram que a topografia do tecido adiposo (AT) está associada a 
complicações metabólicas consideradas fatores de risco para doenças cardiovasculares. 
Segundo os autores, seria importante como parte da avaliação do risco de doenças 
cardiovasculares que fosse medida a quantidade de AT intra-abdominal profunda. A 
tomografia computadorizada (TC) é a única técnica disponível que mede a quantidade de AT 
abdominal, no entanto, é cara e gera radiação. Além disso, tal técnica não está disponível 
para a maioria dos médicos . Desse modo, os autores conduziram um estudo que visou 
desenvolver equações para prever a quantidade de gordura abdominal profunda a partir de 
medidas antropométricas simples. Os participantes eram homens entre as idades de 18 e 42 
anos, que estavam livres de doença metabólica que exigisse tratamento. Entre as medidas 
tomadas em cada sujeito estavam a quantidade de gordura abdominal profunda (obtida 
pela técnica CT) e a circunferência da cintura (em cm. – obtida com uma fita métrica). Uma 
questão de interesse investigada seria predizer o quão bem se poderia estimar a gordura 
abdominal profunda (AT) a partir do conhecimento da circunferência da cintura. 
 
Tal questão é típica das análises de correlação - regressão. 
 AT abdominal é a variável sobre a qual queremos fazer previsões e estimativas (ou 
explicar a variabilidade)  variável dependente. 
 A medida de cintura variável é a variável a ser utilizada para fazer as previsões e 
estimativas  a variável independente. 
-Veja a tabela com os dados de circunferência de cintura e de gordura abdominal profunda 
de cada um dos participantes dos estudo. 
-Veja a tabela com os dados de circunferência de cintura e de gordura abdominal profunda 
de cada um dos participantes dos estudo. 
• O diagrama de dispersão 
 
 Sua construção é o primeiro passo para o entendimento da 
relação entre duas variáveis quantitativas. 
 
 Os pontos são plotados e representam os valores da variável 
independente (circunferência da cintura) no eixo horizontal e 
os valores da variável dependente (gordura abdominal 
profunda) no eixo vertical  cada ponto, uma observação. 
 
 O padrão dos pontos representados graficamente geralmente 
sugere a natureza básica e a força da relação entre duas 
variáveis 
 O que o diagrama de dispersão sugere? 
 
 Há uma relação entre as variáveis 
 
 Podemos resumir o padrão dos pontos por meio de uma reta?  falaremos mais sobre a reta de 
regressão a frente. 
CORRELAÇÃO 
POSITIVA 
Correlações: estudos - exemplos 
http://www.scielo.br/scielo.php?scr
ipt=sci_arttext&pid=S1806-
83242007000300012 
RESUMO 
O objetivo desta pesquisa foi avaliar a idade dentária em 102 indivíduos com síndrome de Down, por meio de 
radiografias panorâmicas. Foi usado um "software" desenvolvido pela disciplina de Radiologia da Faculdade de 
Odontologia de São José dos Campos (UNESP). Neste "software", foi utilizada a tabela de cronologia de mineralização 
dos dentes permanentes entre brasileiros, de Nicodemo, Moraes e Medici Filho (...). Concluiu-se que a maioria dos 
pacientes com síndrome de Down estava dentro do padrão de normalidade de desenvolvimento dentário. Esse 
diagrama de dispersão mostra a relação entre a idade 
dentária e a idade cronológica das meninas participantes 
do estudo. 
 
Variável quantitativa contínua - independente 
Variável quantitativa contínua - dependente 
CORRELAÇÃO 
NEGATIVA 
• Estudaremos a partir do slide seguinte o coeficiente de correlação linear 
que mede a força da correlação linear entre os valores quantitativos 
emparelhados x e y em uma amostra. Ressalta-se que só faz sentido 
calculá-lo se o padrão dos pontos no diagrama de dispersão for 
semelhante ao de uma reta, o que sugere a existência de uma relação 
linear (casos a e b). 
• Coeficiente de correlação linear (r): 
mede a força da correlação linear entre 
valores quantitativos emparelhados x e y em 
uma amostra (varia de -1 a 1). 
 
 
Para dados com distribuição normal – 
COEFICIENTE DE CORRELAÇÃO DE PEARSON. 
 
Para dados com distribuição diferente – 
COEFICIENTE DE CORREÇÃO DE SPEARMAN. 
Obs. – para comparar 
proporções usar teste z (se 
os dados forem normais) OU. 
Tabelas de contingência: usar 
teste Qui-quadrado. 
 
Mediante 
transfor-
mação 
dos dados 
Interpretando os valores possíveis do 
coeficiente de correção linear. 
Interpretando os valores possíveis do 
coeficiente de correção linear. 
• Reforçando: só faz sentido calcular o coeficiente de correlação 
linear se o padrão dos pontos no diagrama de dispersão for 
semelhante ao de uma reta, o que sugere a existência de uma 
relação linear (casos a e b). Veja os valores do coeficiente. 
 Exemplo 4 - hipotético: correlação entre o tamanho da 
língua de cães (em cm) e a quantidade de água que 
conseguem beber em um minuto (em litros). Análise de 
300 animais de diferentes tamanhos. 
 
 Obteve-se um coeficiente de correlação linear (r) de 0,88. 
 Tal valor está próximo de 1 e é positivo. A partir dele podemos 
interpretar que há uma forte correlação entre as variáveis. Cães 
com língua maior conseguem ingerir mais água. 
 Tendo em vista o forte valor da correlação, podemos supor que esta 
é estaticamente significativa (ou seja, tem baixa probabilidade de 
ter ocorrido devido ao acaso). Um teste formal de hipóteses pode 
ser executado para que a significância seja verificada, falaremos 
dele no slide seguinte. 
Teste de hipóteses para verificar a 
significância estatística da correlação 
linear 
• É possível testar a significância estatística dos coeficientes de correlação 
de Pearson e de Spearman por meio de um teste estatístico formal de 
hipóteses, seguindo-se o passo a passo tradicional (estabelecer hipóteses 
– calcular estatística de teste – verificar existência de significância). 
 
• Não serão dados detalhes desse passo a passo, é importante ressaltar 
apenas que a interpretação é a mesma de qualquer outro teste. Observa-
se o P-valor obtido e se este for pequeno (menor que 0,05) conclui-se pela 
existência de significância, ou seja, a correlação obtida tem baixa 
probabilidade de ter ocorrido devido ao acaso. 
 
• Foi esse o caso do exemplo 3 (imunização e mortalidade). O P-valor obtido 
foi igual a 0,03 – ou seja, estatisticamente significativo, sendo o valor de r 
= 0,79 (forte correlação negativa). 
Teste de hipóteses para verificar a 
significância estatística da correlação linear 
– EXEMPLO 5 
• Correlação entre o tamanho da linha da vida e a 
longevidade em cadáveres 
 
 
 
 
 
• Autores M.E. Wilson e L.E. Mather refutaram a crença de que o tamanho da linha 
da vida seria correlacionado com uma maior longevidade. Estudando cadáveres, 
tais autores registravam as idades na morte e os comprimentos das linhas da 
vida. 
 
• Sendo as duas variáveis contínuas (tempo e tamanho), foi realizada uma análise 
de correlação linear que teve um fraco coeficiente de correlação (r=0,1). Ao 
testarem a significância estatística desse coeficiente, encontraram um P-valor 
igual a 0,30, ou seja, não estatisticamente significativo. 
 
• Pelo menos para esses indivíduos, a linha da vidaera apenas uma linha, mas vai 
saber, né? Deixando a linha da vida de lado, vamos falar da reta de regressão. 
 
A reta de REGRESSÃO 
• Vimos até aqui os métodos para encontrarmos e testarmos 
a significância do coeficiente de correlação linear (r) e para 
se determinar se há uma correlação entre duas variáveis. 
 
• Assumindo que uma das variáveis é a variável 
independente (potencial causa) e a outra a variável 
dependente (potencial efeito) podemos encontrar uma 
equação da reta que se ajusta melhor aos dados. 
 
• Tal equação descreve algebricamente a relação entre as 
duas variáveis e é chamada de EQUAÇÃO DE REGRESSÃO e 
a reta de melhor ajuste é a RETA DE REGRESSÃO.. 
• A equação da reta 
VARIÁVEL 
DEPENDENTE - 
RESPOSTA 
VARIÁVEL 
INDEPENDENTE - 
EXPLICATIVA 
INTERCEPTO 
INCLINAÇÃO 
Pelo método dos mínimos quadrados, busca-se a reta de 
regressão que melhor se ajusta ao conjunto de dados por 
meio das fórmulas a seguir (mais uma vez, não faremos esses 
cálculos tediosos e focaremos a interpretação). 
 Equação da reta para o exemplo 1: associação entre a 
circunferência da cintura (variável explicativa) e gordura abdominal 
profunda. -Intercepto: Quando X é 0, Y é -216 
-Inclinação: cada aumento de uma unidade da 
circunferência da cintura, aumenta 3,46 unidades da 
gordura abdominal. 
-Prevendo valores de Y a partir de X - basta substituir na 
equação e fazer a conta: para X = 100, Y=130  ver slide 
seguinte 
Correlações: veja a equação da reta desse exemplo 
http://www.scielo.br/scielo.php?scr
ipt=sci_arttext&pid=S1806-
83242007000300012 
RESUMO 
O objetivo desta pesquisa foi avaliar a idade dentária em 102 indivíduos com síndrome de Down, por meio de 
radiografias panorâmicas. Foi usado um "software" desenvolvido pela disciplina de Radiologia da Faculdade de 
Odontologia de São José dos Campos (UNESP). Neste "software", foi utilizada a tabela de cronologia de mineralização 
dos dentes permanentes entre brasileiros, de Nicodemo, Moraes e Medici Filho (...). Concluiu-se que a maioria dos 
pacientes com síndrome de Down estava dentro do padrão de normalidade de desenvolvimento dentário. Esse 
diagrama de dispersão mostra a relação entre a idade 
dentária e a idade cronológica das meninas participantes 
do estudo. 
 
• ATENÇÃO: CORRELAÇÃO NÃO IMPLICA CAUSALIDADE – 
Análise com múltiplas variáveis explicativas 
 
Olhando os dados do exemplo 3 podemos concluir que há uma 
correlação entre a porcentagem de imunização e a taxa de 
mortalidade, porém não podemos afirmar enfaticamente que o 
aumento na taxa de imunização causa a diminuição na mortalidade. 
Outras variáveis (por exemplo, melhores condições 
socioeconômicas) podem estar envolvidas na relação 
confundimento  daí a importância de serem realizadas análises 
com múltiplas variáveis para que seja analisado o efeito individual 
de cada uma controlando-se pelas demais  REGRESSÃO LINEAR 
MÚLTIPLA OU REGRESSÃO LÓGÍSTICA (desfecho dicotômico: sim X 
não; doente x não doente) etc. 
• ATENÇÃO: CORRELAÇÃO NÃO IMPLICA CAUSALIDADE 
 
Exemplo de interpretação errada: Dr. Nona Nitawitz (foto :) tem 
notado que há uma forte correlação inversa entre a quantidade 
de roupa que as pessoas usam e a temperatura, ou seja, quando 
está muito frio indivíduos usam mais roupa e quando está quente 
indivíduos usam menos roupa. Houve uma onda de frio muito 
amargo nos últimos dez dias. Dr. Nitawitz (já meio lelé e tarada 
igual o Silvio Santos) sugeriu que, dada a forte correlação inversa 
entre a quantidade de roupa e a temperatura, que todos 
deveriam sair apenas com suas roupas íntimas nos próximos dias 
fazendo assim com que a temperatura suba (ela interpretou 
equivocadamente a correlação como uma relação de causa e 
efeito). 
• ATENÇÃO: CORRELAÇÃO NÃO IMPLICA CAUSALIDADE – 
Análise com múltiplas variáveis explicativas 
 
 
• ATENÇÃO: CORRELAÇÃO NÃO IMPLICA CAUSALIDADE – 
Análise com múltiplas variáveis explicativas 
 
 
 
• Análises de regressão múltipla felizmente vêm 
sendo cada vez mais frequentes na área da 
saúde e é fundamental que um bom profissional 
saiba, pelo menos, interpretá-las. 
 
 
• Alguns consideram a regressão linear múltipla e 
a regressão logística apenas as pedras 
fundamentais da boa Epidemiologia e da boa 
Bioestatística.

Continue navegando