Buscar

Aula Correlação e regressão

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

BIOESTATÍSTICA: MC2
Curso de Enfermagem
Correlação e Regressão
Prof. Vinícius Silva Belo
Correlação
Estudaremos agora e na estatística II a relação entre variáveis.
Na correlação, AS DUAS VARIÁVEIS SÃO CONTÍNUAS e queremos ver como elas se relacionam. Se houver alguma relação entre elas, dizemos que há uma correlação. Veremos a força dessa relação e mais a frente a previsão de valores de uma variável a partir da outra e a reta de regressão.
Correlações: estudos - exemplos
Després et al., hipotetizaram que a topografia do tecido adiposo (AT) está associada a complicações metabólicas consideradas fatores de risco para doenças cardiovasculares. Segundo os autores, seria importante como parte da avaliação do risco de doenças cardiovasculares que fosse medida a quantidade de AT intra-abdominal profunda. A tomografia computadorizada (TC) é a única técnica disponível que mede a quantidade de AT abdominal, no entanto, é cara e gera radiação. Além disso, tal técnica não está disponível para a maioria dos médicos . Desse modo, os autores conduziram um estudo que visou desenvolver equações para prever a quantidade de gordura abdominal profunda a partir de medidas antropométricas simples. Os participantes eram homens entre as idades de 18 e 42 anos, que estavam livres de doença metabólica que exigisse tratamento. Entre as medidas tomadas em cada sujeito estavam a quantidade de gordura abdominal profunda (obtida pela técnica CT) e a circunferência da cintura (em cm. – obtida com uma fita métrica). Uma questão de interesse investigada seria predizer o quão bem se poderia estimar a gordura abdominal profunda (AT) a partir do conhecimento da circunferência da cintura. 
Tal questão é típica das análises de correlação - regressão. 
AT abdominal é a variável sobre a qual queremos fazer previsões e estimativas (ou explicar a variabilidade)  variável dependente. 
A medida de cintura variável é a variável a ser utilizada para fazer as previsões e estimativas  a variável independente.
1
-Veja a tabela com os dados de circunferência de cintura e de gordura abdominal profunda de cada um dos participantes dos estudo.
-Veja a tabela com os dados de circunferência de cintura e de gordura abdominal profunda de cada um dos participantes dos estudo.
O que faço com esses números?
O diagrama de dispersão
O diagrama de dispersão
Sua construção é o primeiro passo para o entendimento da relação entre duas variáveis quantitativas.
 Os pontos são plotados e representam os valores da variável independente (circunferência da cintura) no eixo horizontal e os valores da variável dependente (gordura abdominal profunda) no eixo vertical  cada ponto, uma observação.
O padrão dos pontos representados graficamente geralmente sugere a natureza básica e a força da relação entre duas variáveis
O que o diagrama de dispersão sugere?
Há uma relação entre as variáveis
Podemos resumir o padrão dos pontos por meio de uma reta?  falaremos mais sobre a reta de regressão a frente. 
CORRELAÇÃO POSITIVA
Correlações: estudos - exemplos
http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1806-83242007000300012
RESUMO
O objetivo desta pesquisa foi avaliar a idade dentária em 102 indivíduos com síndrome de Down, por meio de radiografias panorâmicas. Foi usado um "software" desenvolvido pela disciplina de Radiologia da Faculdade de Odontologia de São José dos Campos (UNESP). Neste "software", foi utilizada a tabela de cronologia de mineralização dos dentes permanentes entre brasileiros, de Nicodemo, Moraes e Medici Filho (...). Concluiu-se que a maioria dos pacientes com síndrome de Down estava dentro do padrão de normalidade de desenvolvimento dentário. Esse diagrama de dispersão mostra a relação entre a idade dentária e a idade cronológica das meninas participantes do estudo.
2
Variável quantitativa contínua - independente
Variável quantitativa contínua - dependente
3
CORRELAÇÃO NEGATIVA
Estudaremos a partir do slide seguinte o coeficiente de correlação linear que mede a força da correlação linear entre os valores quantitativos emparelhados x e y em uma amostra. Ressalta-se que só faz sentido calculá-lo se o padrão dos pontos no diagrama de dispersão for semelhante ao de uma reta, o que sugere a existência de uma relação linear (casos a e b). 
Coeficiente de correlação linear (r): mede a força da correlação linear entre valores quantitativos emparelhados x e y em uma amostra (varia de -1 a 1).
Para dados com distribuição normal – COEFICIENTE DE CORRELAÇÃO DE PEARSON.
Para dados com distribuição diferente – COEFICIENTE DE CORREÇÃO DE SPEARMAN.
Interpretando os valores possíveis do coeficiente de correção linear.
Interpretando os valores possíveis do coeficiente de correção linear.
Reforçando: só faz sentido calcular o coeficiente de correlação linear se o padrão dos pontos no diagrama de dispersão for semelhante ao de uma reta, o que sugere a existência de uma relação linear (casos a e b). Veja os valores do coeficiente. 
Exemplo 4 - hipotético: correlação entre o tamanho da língua de cães (em cm) e a quantidade de água que conseguem beber em um minuto (em litros). Análise de 300 animais de diferentes tamanhos.
Obteve-se um coeficiente de correlação linear (r) de 0,88. 
Tal valor está próximo de 1 e é positivo. A partir dele podemos interpretar que há uma forte correlação entre as variáveis. Cães com língua maior conseguem ingerir mais água. 
Tendo em vista o forte valor da correlação, podemos supor que esta é estaticamente significativa (ou seja, tem baixa probabilidade de ter ocorrido devido ao acaso). Um teste formal de hipóteses pode ser executado para que a significância seja verificada, falaremos dele no slide seguinte.
Antes: descubra de que forma um cão bebe água
Teste de hipóteses para verificar a significância estatística da correlação linear
É possível testar a significância estatística dos coeficientes de correlação de Pearson e de Spearman por meio de um teste estatístico formal de hipóteses, seguindo-se o passo a passo tradicional (estabelecer hipóteses – calcular estatística de teste – verificar existência de significância). 
Não serão dados detalhes desse passo a passo, é importante ressaltar apenas que a interpretação é a mesma de qualquer outro teste. Observa-se o P-valor obtido e se este for pequeno (menor que 0,05) conclui-se pela existência de significância, ou seja, a correlação obtida tem baixa probabilidade de ter ocorrido devido ao acaso. 
Foi esse o caso do exemplo 3 (imunização e mortalidade). O P-valor obtido foi igual a 0,03 – ou seja, estatisticamente significativo, sendo o valor de r = - 0,79 (forte correlação negativa).
Teste de hipóteses para verificar a significância estatística da correlação linear – EXEMPLO 5
Correlação entre o tamanho da linha da vida e a longevidade em cadáveres
Autores M.E. Wilson e L.E. Mather refutaram a crença de que o tamanho da linha da vida seria correlacionado com uma maior longevidade. Estudando cadáveres, tais autores registravam as idades na morte e os comprimentos das linhas da vida. 
Sendo as duas variáveis contínuas (tempo e tamanho), foi realizada uma análise de correlação linear que teve um fraco coeficiente de correlação (r=0,1). Ao testarem a significância estatística desse coeficiente, encontraram um P-valor igual a 0,30, ou seja, não estatisticamente significativo.
Pelo menos para esses indivíduos, a linha da vida era apenas uma linha, mas vai saber, né? Deixando a linha da vida de lado, vamos falar da reta de regressão.
A reta de REGRESSÃO
Vimos até aqui os métodos para encontrarmos e testarmos a significância do coeficiente de correlação linear (r) e para se determinar se há uma correlação entre duas variáveis.
Assumindo que uma das variáveis é a variável independente (potencial causa) e a outra a variável dependente (potencial efeito) podemos encontrar uma equação da reta que se ajusta melhor aos dados.
Tal equação descrevealgebricamente a relação entre as duas variáveis e é chamada de EQUAÇÃO DE REGRESSÃO e a reta de melhor ajuste é a RETA DE REGRESSÃO..
A equação da reta
VARIÁVEL DEPENDENTE - RESPOSTA
VARIÁVEL INDEPENDENTE - EXPLICATIVA
INTERCEPTO
INCLINAÇÃO
Pelo método dos mínimos quadrados, busca-se a reta de regressão que melhor se ajusta ao conjunto de dados por meio das fórmulas a seguir (mais uma vez, não faremos esses cálculos tediosos e focaremos a interpretação).
22
Equação da reta para o exemplo 1: associação entre a circunferência da cintura (variável explicativa) e gordura abdominal profunda. 
-Intercepto: Quando X é 0, Y é -216 
-Inclinação: cada aumento de uma unidade da circunferência da cintura, aumenta 3,46 unidades da gordura abdominal.
-Prevendo valores de Y a partir de X - basta substituir na equação e fazer a conta: para X = 100, Y=130  ver slide seguinte
Correlações: veja a equação da reta desse exemplo
http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1806-83242007000300012
RESUMO
O objetivo desta pesquisa foi avaliar a idade dentária em 102 indivíduos com síndrome de Down, por meio de radiografias panorâmicas. Foi usado um "software" desenvolvido pela disciplina de Radiologia da Faculdade de Odontologia de São José dos Campos (UNESP). Neste "software", foi utilizada a tabela de cronologia de mineralização dos dentes permanentes entre brasileiros, de Nicodemo, Moraes e Medici Filho (...). Concluiu-se que a maioria dos pacientes com síndrome de Down estava dentro do padrão de normalidade de desenvolvimento dentário. Esse diagrama de dispersão mostra a relação entre a idade dentária e a idade cronológica das meninas participantes do estudo.
2
ATENÇÃO: CORRELAÇÃO NÃO IMPLICA CAUSALIDADE – 
Análise com múltiplas variáveis explicativas
Olhando os dados do exemplo 3 podemos concluir que há uma correlação entre a porcentagem de imunização e a taxa de mortalidade, porém não podemos afirmar enfaticamente que o aumento na taxa de imunização causa a diminuição na mortalidade. Outras variáveis (por exemplo, melhores condições socioeconômicas) podem estar envolvidas na relação confundimento  daí a importância de serem realizadas análises com múltiplas variáveis para que seja analisado o efeito individual de cada uma controlando-se pelas demais  REGRESSÃO LINEAR MÚLTIPLA OU REGRESSÃO LÓGÍSTICA (desfecho dicotômico: sim X não; doente x não doente) etc. 
ATENÇÃO: CORRELAÇÃO NÃO IMPLICA CAUSALIDADE
Exemplo de interpretação errada: Dr. Nona Nitawitz (foto :) tem notado que há uma forte correlação inversa entre a quantidade de roupa que as pessoas usam e a temperatura, ou seja, quando está muito frio indivíduos usam mais roupa e quando está quente indivíduos usam menos roupa. Houve uma onda de frio muito amargo nos últimos dez dias. Dr. Nitawitz (já meio lelé e tarada igual o Silvio Santos) sugeriu que, dada a forte correlação inversa entre a quantidade de roupa e a temperatura, que todos deveriam sair apenas com suas roupas íntimas nos próximos dias fazendo assim com que a temperatura suba (ela interpretou equivocadamente a correlação como uma relação de causa e efeito). 
ATENÇÃO: CORRELAÇÃO NÃO IMPLICA CAUSALIDADE – 
Análise com múltiplas variáveis explicativas
ATENÇÃO: CORRELAÇÃO NÃO IMPLICA CAUSALIDADE – 
Análise com múltiplas variáveis explicativas
Análises de regressão múltipla felizmente vêm sendo cada vez mais frequentes na área da saúde e é fundamental que um bom profissional saiba, pelo menos, interpretá-las.
Alguns consideram a regressão linear múltipla e a regressão logística apenas as pedras fundamentais da boa Epidemiologia e da boa Bioestatística.
OBRIGADO

Continue navegando