Baixe o app para aproveitar ainda mais
Prévia do material em texto
Inferência Causal Segundo Semestre de 2017 / Professores: Augusto C. Souza; Ângela M. Coelho; Marcel T. Vieira Grafos de Probabilidade e Suas Aplicações em Inferência Causal Unidade 2 Grafos de probabilidade Revisão http://dagitty.net/learn/graphs/ Grafos no R: Exercício 1.4.1 Considere o grafo exibido na figura abaixo (A) Nomeie todos os pais de Z. (B) Nomeie todos os antepassados de Z. (C) Nomeie todos os filhos de W. (D) Nomeie todos os descendentes de W. (E) Desenhe todos os caminhos (simples) entre X e T (ou seja, nenhum nó deve aparecer mais de uma vez). (F) Desenhe todos os caminhos orienados entre X e T. Introdução Modelos causais representam o mecanismo pelo qual os dados foram gerados. Dado um modelo causal verdadeiramente completo para, digamos, os resultados dos exames de matemática do ensino médio e dado uma lista completa de valores para cada variável exógena desse modelo, podemos, teoricamente, gerar um ponto de dados (ou seja, um resultado de teste) para qualquer indivíduo. Introdução Modelos causais representam o mecanismo pelo qual os dados foram gerados. Poderíamos, em vez disso, ter uma distribuição de probabilidade que caracterizasse as variáveis exógenas, nos permitiria gerar uma distribuição de pontuações do teste Introdução E se não tivermos nem um modelo causal probabilisticamente especificado, mas apenas uma estrutura gráfica do modelo? Sabemos quais variáveis são causadas por outras variáveis, mas não conhecemos a força ou a natureza dos relacionamentos. Mesmo com informações tão limitadas, podemos discernir muito sobre o conjunto de dados gerado pelo modelo. A partir de um modelo causal gráfico não especificado podemos aprender quais variáveis no conjunto de dados são independentes entre si e quais são independentes uma da outra condicionadas a outras variáveis. Essas independências serão verdadeiras para cada conjunto de dados gerado por um modelo causal com essa estrutura gráfica, independentemente das funções específicas de um SCM. Modelo Estrutural Causal (SCM) Cenários 1. financiamento do ensino médio em dólares (𝑋) escore SAT médio (𝑌) taxa de aceitação da faculdade (𝑍) para um determinado ano. 2. o estado de um interruptor de luz (𝑋), o estado de um circuito elétrico associado (𝑌) o estado de uma lâmpada (𝑍). 3. 1. horas que os participantes de uma corrida à pé trabalham em seus empregos a cada semana (𝑋), 2. horas que os participantes dedicam ao treinamento a cada semana (𝑌) 3. tempo de conclusão, em minutos, que os participantes conseguem na corrida (𝑍). Modelo Estrutural Causal (SCM) Variáveis exógenas – 𝑈𝑋, 𝑈𝑌, 𝑈𝑍 são válidas para quaisquer efeitos desconhecidos ou aleatórios que possam alterar a relação entre as variáveis endógenas. Modelo Estrutural Causal (SCM) 1. Financiamento educacional 𝑉 = 𝑋, 𝑌, 𝑍 𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍 𝐹 = 𝑓𝑋, 𝐹𝑌, 𝐹𝑍 𝑓𝑋 ∶ 𝑋 = 𝑈𝑋 𝑓𝑌 ∶ 𝑌 = 𝑥 3 + 𝑈𝑌 𝑓𝑍 ∶ 𝑍 = 𝑦 16 + 𝑈𝑍 Modelo Estrutural Causal (SCM) 1. Circuito Elétrico 𝑉 = 𝑋, 𝑌, 𝑍 𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍 𝐹 = 𝑓𝑋, 𝐹𝑌 , 𝐹𝑍 𝑓𝑋 ∶ 𝑋 = 𝑈𝑋 𝑓𝑌 ∶ 𝑌 = 𝐹𝑒𝑐ℎ𝑎𝑑𝑜 𝑆𝐸 𝑋 = 𝑜𝑛 𝐸 𝑈𝑌 = 0 𝑂𝑈 𝑋 = 𝑜𝑓𝑓 𝐸 𝑈𝑌 = 1 𝐴𝑏𝑒𝑟𝑡𝑜, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜 𝑓𝑍 ∶ 𝑍 = 𝐹𝑒𝑐ℎ𝑎𝑑𝑜 𝑆𝐸 𝑋 = 𝑜𝑛 𝐸 𝑈𝑌 = 0 𝑂𝑈 𝑋 = 𝑜𝑓𝑓 𝐸 𝑈𝑌 = 1 𝐴𝑏𝑒𝑟𝑡𝑜, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜 Modelo Estrutural Causal (SCM) 1. Corrida 𝑉 = 𝑋, 𝑌, 𝑍 𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍 𝐹 = 𝑓𝑋, 𝐹𝑌, 𝐹𝑍 𝑓𝑋 ∶ 𝑋 = 𝑈𝑋 𝑓𝑌 ∶ 𝑌 = 84 − 𝑥 + 𝑈𝑌 𝑓𝑍 ∶ 𝑍 = 100 𝑦 + 𝑈𝑍 Independência em SCM Nenhum dos SCM anteriores compartilha quaisquer funções em comum. Mas porque eles compartilham uma estrutura gráfica comum, os conjuntos de dados gerados por todos os três SCMs devem compartilhar certas independências. Dependência e Independência em SCM As independências compartilhadas pelos conjuntos de dados gerados por esses três SCMs e as dependências provavelmente compartilhadas por todos esses SCMs são: 1. 𝑍 e 𝑌 são dependentes Para algum 𝑧, 𝑦, 𝑃 𝑍 = 𝑧|𝑌 = 𝑦 ≠ 𝑃 𝑍 = 𝑧 2. 𝑌 e 𝑋 são dependentes Para algum 𝑦, 𝑥, 𝑃 𝑌 = 𝑦 𝑋 = 𝑥 ≠ 𝑃 𝑌 = 𝑦 3. 𝑍 e 𝑋 são provavelmente dependentes Para algum 𝑧, 𝑥, 𝑃 𝑍 = 𝑧 𝑋 = 𝑥 ≠ 𝑃 𝑍 = 𝑧 4. 𝑍 e 𝑋 são independentes, condicionados em 𝑌 Para todo 𝑥, 𝑦, 𝑧, 𝑃 𝑍 = 𝑧 𝑋 = 𝑥, 𝑌 = 𝑦 = 𝑃 𝑍 = 𝑧 𝑌 = 𝑦 Dependência e Independência em SCM Observações Quaisquer duas variáveis, com uma ligação entre elas, são dependentes. Em qualquer modelo causal, independentemente das funções específicas, duas variáveis conectadas por uma ligação são dependentes. Se Z depende de 𝑌 e 𝑌 depende de 𝑋, então por quê 𝑍 é “provavelmente” depende de 𝑋? Dependência e Independência em SCM Casos patológicos: casos intransitivos 𝑉 = 𝑋, 𝑌, 𝑍 𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍 𝐹 = 𝑓𝑋, 𝐹𝑌, 𝐹𝑍 𝑓𝑋 ∶ 𝑋 = 𝑈𝑋 𝑓𝑌 ∶ 𝑌 = 𝑎 𝑏 𝑐 𝑠𝑒 𝑋 = 1 𝑒 𝑈𝑌 = 1 𝑠𝑒 𝑋 = 2 𝑒 𝑈𝑌 = 2 𝑠𝑒 𝑈𝑌 = 2 𝑓𝑍 ∶ 𝑍 = 𝑖 𝑗 𝑠𝑒 𝑌 = 𝑐 𝑜𝑢 𝑈𝑍 = 1 𝑠𝑒 𝑈𝑍 = 2 Dependência e Independência em SCM Observações Caso 4: 𝑍 e 𝑋 são independentes condicionais em 𝑌. Considere que 𝑌 = 𝑎. Queremos saber se, somente nesses casos, o valor de 𝑍 é independente do valor de 𝑋. Examinando apenas os casos em que 𝑌 = 𝑎, quando selecionamos casos com valores diferentes de 𝑋, o valor de 𝑈𝑌 muda de modo a manter 𝑌 em 𝑌 = 𝑎. mas como 𝑍 depende apenas de 𝑌 e 𝑈𝑍, e não de 𝑈𝑌, o valor de 𝑍 permanece inalterado. selecionar um valor diferente de 𝑋 não altera o valor de 𝑍. Então X é independente de Z, condicional em Y. Grafos em Cadeia Regra 1: Independência condicional em cadeias Duas variáveis, 𝑋 e 𝑌, são condicionalmente independentes, dado 𝑍, se houver apenas um caminho unidirecional entre 𝑋 e 𝑌 e Z é qualquer conjunto de variáveis que esteja nesse caminho. Grafos em Cadeia Regra 1: Observações 1. Dadas quaisquer duas variáveis 𝑋 e 𝑌, se o único caminho entre 𝑋 e 𝑌 é composto inteiramente de cadeias, então 𝑋 e 𝑌 são independentes condicionais em qualquer variável intermediária nesse caminho. 2. Esta relação de independência se mantém independentemente das funções que conectam as variáveis. 3. A Regra 1 só vale quando assumimos que os termos de erro 𝑼𝑿, 𝑼𝒀 e 𝑼𝒁 são independentes um do outro. SCM em forma de Grafo Cenários 1. Temperatura, vendas de sorvete e crime A temperatura do dia em uma cidade, em graus Celsius (𝑋), O número de vendas em uma sorveteria local nesse dia (𝑌) e O número de crimes violentos na cidade nesse dia (Z). 𝑉 = 𝑋, 𝑌, 𝑍 𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍 𝐹 = 𝑓𝑋, 𝐹𝑌 , 𝐹𝑍 𝑓𝑋 ∶ 𝑋 = 𝑈𝑋 𝑓𝑌 ∶ 𝑌 = 4𝑥 + 𝑈𝑌 𝑓𝑍 ∶ 𝑍 = 𝑥 10 + 𝑈𝑍 SCM em forma de Grafo Cenários 1. Interruptor e duas lâmpadas O estado (para cima ou para baixo) de um interruptor (𝑋), o estado (ligada ou desligada) de uma lâmpada (𝑌) e o estado (ligada ou desligada) de uma segunda lâmpada (𝑍) 𝑉 = 𝑋, 𝑌, 𝑍 𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍 𝐹 = 𝑓𝑋, 𝐹𝑌, 𝐹𝑍 𝑓𝑋 ∶ 𝑋 = 𝑈𝑋 𝑓𝑌 ∶ 𝑌 = 𝐿𝑖𝑔𝑎𝑑𝑎 𝑆𝐸 𝑋 = 𝑐𝑖𝑚𝑎 𝐸 𝑈𝑌 = 0 𝑂𝑈 𝑋 = 𝑏𝑎𝑖𝑥𝑜 𝐸 𝑈𝑌 = 1 𝐷𝑒𝑠𝑙𝑖𝑔𝑎𝑑𝑎, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜 𝑓𝑍 ∶ 𝑍 = 𝐿𝑖𝑔𝑎𝑑𝑎 𝑆𝐸 𝑋 = 𝑐𝑖𝑚𝑎 𝐸 𝑈𝑌 = 0 𝑂𝑈 𝑋 = 𝑏𝑎𝑖𝑥𝑜 𝐸 𝑈𝑌 = 1 𝐷𝑒𝑠𝑙𝑖𝑔𝑎𝑑𝑎, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜 Dependência e Independênciaem SCM em formato de Garfo Se assumirmos que os termos de erro 𝑈𝑋, 𝑈𝑌 e 𝑈𝑍 são independentes, então, examinando o modelo gráfico podemos determinar que os SCMs acima compartilham as seguintes dependências e independências: 1. 𝑋 e 𝑌 são dependentes Para algum 𝑥, 𝑦, 𝑃 𝑍 = 𝑥|𝑌 = 𝑦 ≠ 𝑃 𝑋 = 𝑥 2. 𝑋 e 𝑍 são dependentes Para algum 𝑥, 𝑧, 𝑃 𝑋 = 𝑥 𝑍 = 𝑧 ≠ 𝑃 𝑋 = 𝑥 3. 𝑍 e 𝑌 são provavelmente dependentes Para algum 𝑧, 𝑦, 𝑃 𝑍 = 𝑧 𝑌 = 𝑦 ≠ 𝑃 𝑍 = 𝑧 4. 𝑌 e 𝑍 são independentes, condicionados em 𝑋 Para todo 𝑥, 𝑦, 𝑧, 𝑃 𝑌 = 𝑦 𝑍 = 𝑧, 𝑋 = 𝑥 = 𝑃 𝑌 = 𝑦 𝑋 = 𝑥 Dependência e Independência em SCM em formato de Garfo Observações Os pontos 1 e 2 seguem, mais uma vez, o fato de que 𝑌 e 𝑍 estão diretamente conectados a 𝑋 por uma seta. Se 𝑌 muda quando 𝑋 muda e 𝑍 também muda quando 𝑋 muda, então é provável (embora não seja certo) que 𝑌 muda junto com 𝑍 e vice-versa. Assim sendo, Uma vez que uma alteração no valor de 𝑌 nos dá informações sobre uma alteração associada no valor de 𝑍, 𝑌 e 𝑍 são provavelmente variáveis dependentes. Dependência e Independência em SCM em formato de Garfo Observações Como o 𝑋 não muda, os valores de 𝑌 e 𝑍 não mudam de acordo com 𝑋 – eles mudam apenas em resposta a 𝑈𝑌 e 𝑈𝑍, que assumimos ser independentes. Portanto, quaisquer alterações adicionais nos valores de 𝑌 e 𝑍 devem ser independentes uma da outra. Grafos em Garfo Se duas variáveis compartilham uma causa comum, e se essa causa comum faz parte do único caminho entre elas, então o raciocínio análogo ao acima nos diz que essas dependências e independências condicionais são verdadeiras para essas variáveis. Regra 2 (Independência condicional em Garfos) Se uma variável 𝑋 é uma causa comum das variáveis 𝑌 e 𝑍 e existe apenas um caminho entre 𝑌 e 𝑍, então 𝑌 e 𝑍 são independentes condicionais em 𝑋. Colisão (colliders) A versão mais simples de um grafo de colisão ocorre quando um vértice recebe setas de outros dois vértices. Grafo de Colisão Relações de dependência e independência 1. 𝑋 e 𝑍 são dependentes. Para alguns 𝑥, 𝑧, 𝑃 𝑋 = 𝑥 𝑍 = 𝑧 ≠ 𝑃 𝑋 = 𝑥 2. 𝑌 e 𝑍 são dependentes. Para alguns 𝑦, 𝑧, 𝑃 𝑌 = 𝑦 𝑍 = 𝑧 ≠ 𝑃 𝑌 = 𝑦 3. 𝑋 e 𝑌 são independentes. Para todo 𝑥, 𝑦, 𝑃 𝑋 = 𝑥 𝑌 = 𝑦 = 𝑃 𝑋 = 𝑥 4. 𝑋 e 𝑌 são dependentes condicionais em 𝑍. Para alguns 𝑥, 𝑦, 𝑧, 𝑃(𝑋 = 𝑥|𝑌 = 𝑦, 𝑍 = 𝑧) ≠ 𝑃 (𝑋 = 𝑥|𝑍 = 𝑧) Grafo de Colisão Relações de dependência e independência 1. 𝑋 e 𝑍 são dependentes. Para alguns 𝑥, 𝑧, 𝑃 𝑋 = 𝑥 𝑍 = 𝑧 ≠ 𝑃 𝑋 = 𝑥 2. 𝑌 e 𝑍 são dependentes. Para alguns 𝑦, 𝑧, 𝑃 𝑌 = 𝑦 𝑍 = 𝑧 ≠ 𝑃 𝑌 = 𝑦 A veracidade dos dois primeiros pontos foi estabelecida anteriormente Grafo de Colisão Relações de dependência e independência 3. 𝑋 e 𝑌 são independentes. Para todo 𝑥, 𝑦, 𝑃 𝑋 = 𝑥 𝑌 = 𝑦 = 𝑃 𝑋 = 𝑥 Nem 𝑋 nem 𝑌 são descendentes ou antepassados um do outro, nem dependem da mesma variável. Eles respondem apenas a 𝑈𝑋 e 𝑈𝑌, que são considerados independentes, portanto, não há mecanismo causal pelo qual as variações no valor de 𝑋 devem estar associadas a variações no valor de 𝑌. Grafo de Colisão Relações de dependência e independência 4. 𝑋 e 𝑌 são dependentes condicionais em 𝑍. Para alguns 𝑥, 𝑦, 𝑧, 𝑃(𝑋 = 𝑥|𝑌 = 𝑦, 𝑍 = 𝑧) ≠ 𝑃 (𝑋 = 𝑥|𝑍 = 𝑧) Por que duas variáveis independentes de repente se tornariam dependentes quando condicionamos ao efeito de cada uma, que é comum? Grafo de Colisão Relações de dependência e independência 4. 𝑋 e 𝑌 são dependentes condicionais em 𝑍. Para alguns 𝑥, 𝑦, 𝑧, 𝑃(𝑋 = 𝑥|𝑌 = 𝑦, 𝑍 = 𝑧) ≠ 𝑃 (𝑋 = 𝑥|𝑍 = 𝑧) Como 𝑍 depende, para o seu valor, de 𝑋 e 𝑌, ao comparar casos em que Z assume, por exemplo, o valor 𝑎, qualquer alteração no valor de 𝑋 deve ser compensada por uma alteração no valor de 𝑌 – caso contrário, o valor de 𝑍 também mudaria. Grafo de Colisão Relações de dependência e independência 4. 𝑋 e 𝑌 são dependentes condicionais em 𝑍. Para alguns 𝑥, 𝑦, 𝑧, 𝑃(𝑋 = 𝑥|𝑌 = 𝑦, 𝑍 = 𝑧) ≠ 𝑃 (𝑋 = 𝑥|𝑍 = 𝑧) De um modo geral, O condicionamento em um vértice de colisão produz uma dependência entre os pais do vértice Exemplo 1 Suponha que uma certa faculdade dê bolsas de estudo a dois tipos de alunos: aqueles com talentos musicais extraordinários e aqueles com notas médias extraordinárias. Estes dois traços são independentes? Se você encontrar alguém que tenha recebido uma bolsa nesta faculdade muda alguma coisa? Nesta situação, saber que o bolsista não possui nenhum talento musical, nos informa o que... Exemplo 2 Considere o lançamento simultâneo (independente) de duas moedas honestas e um sino que toca sempre que pelo menos uma das moedas caia com a face “cara” voltada para cima Sejam os resultados das duas moedas denotados por 𝑋 e 𝑌, respectivamente, e seja 𝑍 o estado do sino, com 𝑍 = 1 representando “o sino toca” e 𝑍 = 0 representando o silêncio. Exemplo 2 Se assumirmos que ouvimos o toque da sino, a probabilidade de que a moeda 1 dê cara muda se descobrimos que a moeda 2 também deu cara? Exemplo 2 Se assumirmos que ouvimos o toque da sino, a probabilidade de que a moeda 1 dê cara muda se descobrimos que a moeda 2 também deu cara? Considere as seguintes probabilidades iniciais: 𝑿 𝒀 𝒁 𝑷 𝑿, 𝒀, 𝒁 Cara Cara 1 0,25 Cara Coroa 1 0,25 Coroa Cara 1 0,25 Coroa Coroa 0 0,25 Exemplo 2 𝑋 e 𝑌 são independents 𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑌 = “𝐶𝑎𝑟𝑎” = 𝑃 𝑋 = “𝐶𝑜𝑟𝑜𝑎” 𝑌 = “𝐶𝑜𝑟𝑜𝑎” = 1 2 Agora, vamos condicionar em 𝑍 = 1 e 𝑍 = 0 Exemplo 2 Condicionado em 𝑍 = 1 e 𝑍 = 0 𝑿 𝒀 𝑷 𝑿, 𝒀 𝒁 = 𝟏 Cara Cara 0,333 Cara Coroa 0,333 Coroa Cara 0,333 Coroa Coroa 0 𝑿 𝒀 𝑷 𝑿, 𝒀 𝒁 = 𝟎 Cara Cara 0 Cara Coroa 0 Coroa Cara 0 Coroa Coroa 1 Exemplo 2 Se assumirmos que ouvimos o toque da sino, a probabilidade de que a moeda 1 dê cara muda se descobrimos que a moeda 2 também deu cara? 𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑍 = 1 = 1 3 + 1 3 = 2 3 𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑌 = “𝐶𝑎𝑟𝑎”, 𝑍 = 1 = 1 2 Grafo de colisão com descendentes Assim como condicionar em um vértice de colisão torna as variáveis anteriormente independentes em dependentes, o condicionamento em qualquer descendente de um vértice de colisão também os torna dependentes. Grafo de colisão com descendentes Retornemos ao exemplo das moedas e do sino: Suponhamos que não ouvimos diretamente o sino, mas contamos com o relato de uma testemunha que é pouco confiável; sempre que a campainha não toca, há 50% de chance de que nossa testemunha fale falsamente que a campainha tocou. Seja 𝑊 o relato da testemunha. Grafo de colisão com descendentes Probabilidades para todas as combinações de 𝑋, 𝑌 e 𝑊 𝑿 𝒀 𝑾 𝑷 𝑿, 𝒀,𝑾 Cara Cara 1 0,25 Cara Coroa 1 0,25 Coroa Cara 1 0,25 Coroa Coroa 1 0,125 Coroa Coroa 0 0,125 Grafo de colisão com descendentes Podemos verificar que 𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑌 = “𝐶𝑎𝑟𝑎” = 𝑃 𝑋 = “𝐶𝑎𝑟𝑎” = 1/2 e 𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑊 = 1 = 0,25 + 0,25 0,25 + 0,25 + 0,25 + 0,125 = 0,5 0,85 e 𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑌 = "𝐶𝑎𝑟𝑎",𝑊 = 1 = 0,25 0,25 + 0,25 = 0,5 < 0,5 0,85 Grafos de Colisão Regra 3 (Dependência condicional em colisões) Se uma variável 𝑍 é um vértice de colisão entreduas variáveis 𝑋 e 𝑌, e existe apenas um caminho entre 𝑋 e 𝑌, então 𝑋 e 𝑌 são incondicionalmente independentes, mas dependentes condicionais em 𝑍 e em qualquer descendente de 𝑍. Grafos de Colisão Observações A regra 3 é extremamente importante para o estudo da causalidade. Veremos que esta regra nos permite testar se um modelo causal poderia ter gerado um conjunto de dados, Descobrir modelos a partir de dados e resolver totalmente o Paradox de Simpson, determinando quais variáveis a serem medidas e como estimar os efeitos causais sob variáveis de confusão. Exercício - Solução Regras básicas Regra 1: Independência condicional em cadeias Duas variáveis, 𝑋 e 𝑌, são condicionalmente independentes, dado 𝑍, se houver apenas um caminho unidirecional entre 𝑋 e 𝑌 e Z é qualquer conjunto de variáveis que esteja nesse caminho. Regra 2 (Independência condicional em Garfos) Se uma variável 𝑋 é uma causa comum das variáveis 𝑌 e 𝑍 e existe apenas um caminho entre 𝑌 e 𝑍, então 𝑌 e 𝑍 são independentes condicionais em 𝑋. Regra 3 (Dependência condicional em colisões) Se uma variável 𝑍 é um vértice de colisão entre duas variáveis 𝑋 e 𝑌, e existe apenas um caminho entre 𝑋 e 𝑌, então 𝑋 e 𝑌 são incondicionalmente independentes, mas dependentes condicionais em 𝑍 e em qualquer descendente de 𝑍. d-separação (d-separation) Na maioria dos modelos gráficos, os pares de variáveis serão conectados por vários caminhos possíveis e cada um desses caminhos irá passar por uma variedade de cadeias, garfos e colisões. Existe um critério ou processo que pode ser aplicado a um modelo causal gráfico de qualquer complexidade para prever dependências compartilhadas por todos os conjuntos de dados gerados por esse gráfico? d-separação (d-separation) É construída de acordo com as regras estabelecidas anteriormente. d-separação (o d significa “directional”) nos permite determinar, para qualquer par de vértices, se os vértices são d-conectados, o que significa que existe um caminho de conexão entre eles, ou Os vértices são, provavelmente, dependentes. (casos intrasitivos) d-separados, o que significa que não existe esse caminho. as variáveis que os vértices representam são definitivamente independentes d-separação (d-separation) Observações Dois vértices 𝑋 e 𝑌 são d-separados se todos os caminhos entre eles (se existir algum) estiverem bloqueados. Se mesmo apenas um caminho entre 𝑋 e 𝑌 for desbloqueado, 𝑋 e 𝑌 são d-conectados. Existem certos tipos de vértices que podem bloquear um caminho, dependendo se estamos executando uma d- separação incondicional ou condicional. Se não estamos condicionando em qualquer variável, então apenas as colisões podem bloquear um caminho. Então, se cada caminho entre dois vértices 𝑋 e 𝑌 tiver uma colisão, 𝑋 e 𝑌 não podem ser incondicionalmente dependentes; eles devem ser marginalmente independentes. d-separação (d-separation) Observações Se, no entanto, estamos condicionando em um conjunto de vértices 𝑍, então os seguintes tipos de vértices podem bloquear um caminho: Uma colisão que não está condicionada (isto é, não está em 𝑍), e que não possui descendentes em 𝑍. Uma cadeia ou garfo cujo vértice central está em 𝑍. Justificativas Se um vértice de colisão não está no conjunto de condicionamento 𝑍, então a dependência é bloqueada; (independência) mas, se vértice de colisão, ou seus descendentes, está no conjunto de condicionamento, então, a dependência está presente. Por outro lado, a dependência pode passar através de cadeias e garfos - mas as Regras 1 e 2 nos dizem que quando cadeias e garfos são condicionados, as variáveis em cada extremidade desses caminhos tornam-se independentes (quando consideramos um caminho por vez). Portanto, qualquer vértice de não-colisão no conjunto de condicionamento bloquearia a dependência, enquanto que um que não está no conjunto de condicionamento permitiria a dependência. Definição geral da d-separação Um caminho 𝒑 é bloqueado por um conjunto de vértices 𝒁 se, e somente se, 1: 1. 𝑝 contém uma cadeia de vértices A → B → C ou um garfo A ← B → C tal que o vértice do meio, B, está em 𝑍 (ou seja, 𝑝 está condicionado em 𝐵), ou 2. 𝑝 contém uma colisão A → B ← C tal que o vértice de colisão B não está em 𝑍, e nenhum descendente de B está em 𝑍. Se 𝑍 bloquear todos os caminhos entre dois nós 𝑋 e 𝑌, então 𝑋 e 𝑌 são d-separados, condicionais em 𝑍 e, portanto, são independentes em 𝑍. caminho bloqueado = variáveis independentes Exemplo 1 Observações Este grafo pode estar associado a qualquer modelo causal. As variáveis podem ser discretas, contínuas ou uma mistura das duas. As relações entre eles podem ser lineares, exponenciais ou qualquer outra relação. Independentemente do modelo, no entanto, a d-separação sempre proporcionará o mesmo conjunto de independências nos dados que o modelo gera. Exemplo 1 Considere a relação entre 𝑍 e 𝑌. Usando um conjunto de condicionamento vazio, 𝑍 = , eles são d-separados, o que nos diz que 𝑍 e 𝑌 são incondicionalmente independentes. Por quê? Exemplo 1 Considere a relação entre 𝑍 e 𝑌. Usando um conjunto de condicionamento vazio, 𝑍 = , eles são d-separados, o que nos diz que 𝑍 e 𝑌 são incondicionalmente independentes. Por quê? Existe apenas um caminho entre 𝑍 e 𝑌 e esse caminho é bloqueado por uma colisão (Z → W ← X). Exemplo 1 Considere a relação entre 𝑍 e 𝑌. Suponha, agora, que condicionamos o caminho em 𝑊. As regras da d-separação nos diz que 𝑍 e Y são d-conectados, condicionado em 𝑊. Por quê? Exemplo 1 Considere a relação entre 𝑍 e 𝑌. Suponha, agora, que condicionamos o caminho em 𝑊. As regras da d-separação nos diz que 𝑍 e Y são d-conectados (dependentes), condicionado em 𝑊. Por quê? Neste caso em que o conjunto de condicionamento é 𝑊 e tem um único caminho entre 𝑍 e 𝑌que contém um garfo (𝑋) que não está no conjunto 𝑊 , e o único vértice de colisão (𝑊) no caminho está nesse conjunto, esse caminho não está bloqueado. O mesmo é verdade se condicionarmos em 𝑈, porque 𝑈 é um descendente de uma colisão ao longo do caminho entre 𝑍 e 𝑌. Exemplo 1 Considere a relação entre 𝑍 e 𝑌. Considere, agora, que condicionamos o caminho ao conjunto 𝑊,𝑋 , 𝑍 e 𝑌 continuam dependentes? Exemplo 1 Considere a relação entre 𝑍 e 𝑌. Considere, agora, que condicionamos o caminho ao conjunto 𝑊,𝑋 , 𝑍 e 𝑌 continuam dependentes? Existe agora no caminho em ter 𝑍 e 𝑌 um vértice não-colisor (𝑋) que está no conjunto de condicionamento. Embora 𝑊 tenha sido desbloqueado por condicionamento, um vértice bloqueado é suficiente para bloquear todo o caminho. Uma vez que o único caminho entre 𝑍 e 𝑌 está bloqueado por este conjunto de condicionamento, 𝑍 e 𝑌 são 𝑑- separados condicionados em {𝑊, 𝑋}. Exemplo 2 Agora 𝑍 e 𝑌 agora são incondicionalmente dependentes. Por quê? Exemplo 2 Agora 𝑍 e 𝑌 agora são incondicionalmente dependentes. Por quê? Porque há um caminho entre eles (Z ← T → Y) que não contém colisões. Exemplo 2 Condicionando o caminho em 𝑇 O que acontece? Exemplo 2 Condicionando o caminho em 𝑇 O que acontece? Esse caminho fica bloqueado e 𝑍 e 𝑌 tornam-se independentes novamente Exemplo 2 Condicionando o caminho em 𝑇 O que acontece? Esse caminho fica bloqueadoe 𝑍 e 𝑌 tornam-se independentes novamente Condicionando o caminho em 𝑇,𝑊 Exemplo 2 Condicionando o caminho em 𝑇 O que acontece? Esse caminho fica bloqueado e 𝑍 e 𝑌 tornam-se independentes novamente Condicionando o caminho em 𝑇,𝑊 Torna-os conectados novamente (dependentes). O condicionamento em 𝑇 bloqueia o caminho Z ← T → Y, mas o condicionamento em 𝑊 desbloqueia o caminho Z → W ← X → Y. Exemplo 2 Condicionando o caminho em 𝑇,𝑊, 𝑋 O que acontece? Exemplo 2 Condicionando o caminho em 𝑇,𝑊, 𝑋 O que acontece? 𝑍 e 𝑌 tornam-se independentes novamente! Por quê? Exemplo 2 Resumo 𝑍 e 𝑌 são d-conectados (e, portanto, provavelmente dependentes) condicionais em 𝑊, U, 𝑊,𝑈 , 𝑊,𝑇 , 𝑈, 𝑇 , 𝑊,𝑈, 𝑇 , 𝑊,𝑋 , 𝑈, 𝑋 e {𝑊,𝑈, 𝑋}. Eles são 𝑑-separados (e, portanto, independentes) em 𝑇, 𝑋, 𝑇 , 𝑊,𝑋, 𝑇 , 𝑈, 𝑋, 𝑇 e 𝑊,𝑈, 𝑋, 𝑇 . Exemplo 2 Observação Eles são 𝑑-separados (e, portanto, independentes) em 𝑇, 𝑋, 𝑇 , 𝑊,𝑋, 𝑇 , 𝑈, 𝑋, 𝑇 e 𝑊,𝑈, 𝑋, 𝑇 . Observe que 𝑇 está em cada conjunto de condicionamento que d-separa 𝑍 e 𝑌; Isso é porque 𝑇 é o único vértice em um caminho que incondicionalmente 𝑑- conecta 𝑍 e 𝑌, então, a menos que o caminho esteja condicionado, 𝑍 e 𝑌 sempre serão 𝑑-conectados. Exercício Teste de modelo e pesquisa causal Vimos que modelos causais têm implicações testáveis nos conjuntos de dados que geram. se tivermos um grafo 𝐺 que acreditamos que poderia ter gerado um conjunto de dados 𝑆, a 𝑑-separação nos indicará quais variáveis em 𝐺 devem ser condicionalmente independentes sobre quais outras variáveis. Como isso funciona? Suponhamos que listamos as condições de d-separação em 𝐺 e notamos que as variáveis 𝐴 e 𝐵 devem ser independentes condicionais em 𝐶. Suponha, agora, que estimemos as probabilidades com base em 𝑆 e descobrimos que os dados sugerem que 𝐴 e 𝐵 não são independentes condicionais em 𝐶. Podemos então rejeitar 𝐺 como um possível modelo causal para 𝑆. Exemplo Considerando que 𝑊 e 𝑍1 são independentes, dado 𝑋. Suponha que regredimos 𝑊 em 𝑋 e 𝑍1. 𝑤 = 𝑎𝑥 + 𝑏𝑧1 Se, ao avaliarmos o modelo, verificar-mos que 𝑏 não é igual a zero, sabemos que 𝑊 depende de 𝑍1 dado 𝑋 e, conseqüentemente, que o modelo está errado. Exemplo Observações Neste caso, sabemos também onde está errado; o modelo (grafo) causal verdadeiro deve ter um caminho entre 𝑊 e 𝑍1 que não seja d-separado por 𝑋. Este é um resultado teórico que é válido para todos os modelos acíclicos com erros independentes Cada condição de separação do modelo corresponde a uma independência condicional nos dados, nenhum outro teste pode refutar o modelo. Método tradicional de teste de ajuste de um modelo Teste de hipóteses estatísticas de todo o modelo avaliamos o quão provável é que a amostra observada tenham sido gerada pelo modelo proposto na hipótese, ao contrário de ter ocorrido por pura chance. Isso pode ser feito (aproximadamente) assumindo um modelo linear e gaussiano, Como, sob tais pressupostos, a distribuição da conjunta pode ser expressa sucintamente em termos dos parâmetros do modelo, e podemos então avaliar a probabilidade de que as amostras observadas tenham sido geradas pelo modelo totalmente parametrizado. Método tradicional de teste de ajuste de um modelo Questões importantes 1. Se algum parâmetro não puder ser estimado, a distribuição conjunta não pode ser estimada e o modelo não pode ser testado. Os termos de erro estão correlacionados ou algumas das variáveis não são observadas. 2. Modelo testado globalmente. Dificuldade de identificar o motivo da falta de ajuste. 3. Quando testamos um modelo de forma global, o número de variáveis envolvidas pode ser grande e, se houver erro de mensuração / ou uma variação amostral associada a cada variável, o teste não será confiável. Vantagens da d-separação 1. É não-paramétrico não depende das funções específicas que conectam variáveis. 2. Testa modelos localmente, em vez de globalmente. permite identificar pontos específicos onde nosso modelo apresenta problemas e repará-los. Classes de equivalência de DAG classe de equivalência: conjunto de grafos com implicações indistinguíveis. Dois grafos 𝐺1 e 𝐺2 estão na mesma classe de equivalência se compartilham as mesmas ligações, independentemente da direção e se compartilham vértices de colisão cujos pais não são adjacente (v-estrutura). Quaisquer dois grafos que satisfaçam este critério têm conjuntos idênticos de condições de d-separação e, portanto, conjuntos idênticos de implicações testáveis. Classes de equivalência de DAG A importância desse resultado é que nos permite pesquisar um conjunto de dados para os modelos causais que poderiam tê-lo gerado. Assim, não só podemos começar com um modelo causal e gerar um conjunto de dados, mas também podemos começar com um conjunto de dados e buscar a um modelo causal que o explique. Os Efeitos das Intervenções O objetivo final de muitos estudos estatísticos é prever os efeitos das intervenções. Características de incêndios florestais X frequência de incêndios Quando coletamos dados sobre fatores associados a incêndios florestais, estamos realmente procurando por algo que possamos intervir para diminuir a frequência do incêndio. Fármaco contra o câncer X estado de saúde de um paciente Quando realizamos um estudo sobre um novo fármaco contra o câncer, estamos tentando identificar como a doença de um paciente responde quando intervimos medicando o paciente. Violência em programas de televisão X agressividade de crianças Quando pesquisamos a correlação entre programas de televisão violentos e os atos de agressão em crianças, estamos tentando determinar se intervir na redução do acesso das crianças à programas de televisão violentos reduzirá sua agressividade. Os Efeitos das Intervenções Padrão ouro Experimento Controlado Randomizado Em um experimento controlado devidamente aleatorizado, todos os fatores que influenciam a variável resposta são estáticos ou variam ao acaso, exceto por uma, então qualquer alteração na variável resposta deve ser creditada a essa variável. Os Efeitos das Intervenções Características de incêndios florestais X frequência de incêndios Não podemos controlar o tempo, portanto não podemos randomizar as variáveis que afetam os incêndios florestais. Fármaco contra o câncer X estado de saúde de um paciente Os ensaios clínicos aleatorizados de drogas podem ter problemas quando os participantes abandonam, não conseguem tomar a medicação ou notificam erroneamente seu uso. Violência em programas de televisão X agressividade de crianças Poderíamos alocar aleatoriamente os participantes em um estudo sobre violência na televisão, mas seria difícil controlar efetivamente a quantidade de televisão que cada criança assiste e quase impossível saber se os controlamos efetivamente ou não. Os Efeitos das Intervenções Alternativa... Estudos observacionais Os dados são apenas registrados, em vez de controlados. Problema É difícil separar o que é causal daquilo que é meramente uma correlação. Exemplos Hábito de tomar vinho X risco de ataque cardíaco Vacina contra gripe X risco de morte no ano seguinte Vitamina C X saúde geral Superficialidade X quantidade de troca de mensagens de texto ... Diferença entre intervirem uma variável e condicionar nessa variável Quando intervimos em uma variável em modelo, nós corrigimos seu valor. Quando condicionamos uma variável, não mudamos nada; simplesmente limitamos nosso foco ao subconjunto de casos em que a variável assume o valor que nos interessa. Diferença entre intervir em uma variável e condicionar nessa variável Exemplo Grafo representando a relação entre a temperatura (𝑍), as vendas de sorvete (𝑋) e as taxas de criminalidade (𝑌) Grafo representando uma intervenção no modelo na ao lado com a redução nas vendas de sorvete Intervir em uma variável, resulta em um padrão de dependências totalmente diferente do que o condicionamento em uma variável. Notação 𝑃 𝑌 = 𝑦 𝑋 = 𝑥 é a probabilidade de 𝑌 = 𝑦 condicional ao valor 𝑋 = 𝑥, enquanto que 𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥 é a probabilidade de 𝑌 = 𝑦 quando intervimos para fazer 𝑋 = 𝑥. 𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥 , 𝑍 = 𝑧 denota a probabilidade condicional de 𝑌 = 𝑦, dado 𝑍 = 𝑧, na distribuição criada pela intervenção 𝑑𝑜 𝑋 = 𝑥 . OBS.: 𝑃 𝑌 = 𝑦 𝑋 = 𝑥 reflete a distribuição populacional de 𝑌 entre indivíduos cujo valor 𝑋 é 𝑥. Por outro lado, 𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥 representa a distribuição populacional de 𝑌 se todos na população tiverem seu valor 𝑋 fixado em 𝑥. A Fórmula de Ajuste Considere o seguinte exemplo onde 𝑋 representa o uso de um fármaco, 𝑌 representa a recuperação, e 𝑍 significa sexo. Exemplo: efeito de uma droga Para descobrir o quão eficaz é a droga na população, imaginamos uma intervenção hipotética através da qual administrarmos a droga uniformemente a toda a população e comparamos a taxa de recuperação com o que seria obtido sem a intervenção, onde evitamos que todos usem a droga. Considere 𝑑𝑜 𝑋 = 1 = todos tomam a droga 𝑑𝑜 𝑋 = 0 = ninguém toma a droga O objetivo é estimar 𝑃(𝑌 = 1|𝑑𝑜(𝑋 = 1)) − 𝑃(𝑌 = 1|𝑑𝑜(𝑋 = 0)) "Diferença de efeito causal" ou "efeito causal médio" (ACE). Fórmula de ajuste Observações Se 𝑋 e 𝑌 podem assumir mais de um valor, gostaríamos de prever o efeito causal geral 𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥 os efeitos causais não podem ser estimados a partir do próprio conjunto de dados sem uma história causal (paradoxo de Simpson) mas com a ajuda do grafo, podemos calcular a magnitude do efeito causal a partir dos dados. Exemplo: efeito de uma droga com intervenção 𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥 = 𝑃𝑚 𝑌 = 𝑦 𝑋 = 𝑥 𝑃𝑚, a probabilidade manipulada, compartilha duas propriedades essenciais com 𝑃 1. a probabilidade marginal 𝑃 𝑍 = 𝑧 é invariante sob a intervenção, o processo que determina 𝑍 não é afetado pela remoção da ligação de 𝑍 para 𝑋. (as proporções de homens e mulheres permanecem as mesmas antes e depois da intervenção) 2. a probabilidade condicional 𝑃 𝑌 = 𝑦 𝑍 = 𝑧, 𝑋 = 𝑥 é invariante processo pelo qual 𝑌 responde a 𝑋 e 𝑍, 𝑌 = 𝑓 𝑥, 𝑧, 𝑢𝑌 permanece o mesmo, independentemente de 𝑋 mudar espontaneamente ou por manipulação deliberada. Exemplo: efeito de uma droga com intervenção Equações de invariância 1. 𝑃𝑚 𝑍 = 𝑧 = 𝑃 𝑍 = 𝑧 e 2. 𝑃𝑚 𝑌 = 𝑦 𝑍 = 𝑧, 𝑋 = 𝑥 = 𝑃 𝑌 = 𝑦 𝑍 = 𝑧, 𝑋 = 𝑥 Exemplo: efeito de uma droga com intervenção Como 𝑍 e 𝑋 são d-separados (independentes) no modelo modificado, temos que Isso nos diz que 𝑃𝑚 𝑍 = 𝑧 𝑋 = 𝑥 = 𝑃𝑚 𝑍 = 𝑧 = 𝑃 𝑍 = 𝑧 Juntando essas considerações, temos 𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥 = 𝑃𝑚 𝑌 = 𝑦 𝑋 = 𝑥 (por definição) = 𝑧 𝑃𝑚 𝑌 = 𝑦 𝑋 = 𝑥, 𝑍 = 𝑧 𝑃𝑚 𝑍 = 𝑧 𝑋 = 𝑥 = 𝑧 𝑃𝑚 𝑌 = 𝑦 𝑋 = 𝑥, 𝑍 = 𝑧 𝑃𝑚 𝑍 = 𝑧 Exemplo: efeito de uma droga com intervenção Usando as relações de invariância, obtemos uma fórmula para o efeito causal, em termos das probabilidades de pré-intervenção: 𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥 = 𝑧 𝑃 𝑌 = 𝑦 𝑋 = 𝑥, 𝑍 = 𝑧 𝑃 𝑍 = 𝑧 Este procedimento é conhecido como "ajustar para Z" ou "controlar para Z." Fórmula de ajuste: exemplo numérico Exemplo: efeito de uma droga com intervenção 𝑋 = 1: o paciente que toma o medicamento, 𝑍 = 1: o paciente é homem e 𝑌 = 1: paciente em recuperação. Gênero Usaram a nova droga Não usaram a nova droga Masculino 81 de 87 se recuperaram (93%) 234 de 270 se recuperaram (87%) Feminino 192 de 263 se recuperaram (73%) 55 de 80 se recuperaram (69%) Total 273 de 350se recuperaram (78%) 289 de 350 se recuperaram (83%) Tabela 1: Resultados de um estudo sobre uma nova droga, levando o gênero em consideração. Fórmula de ajuste: exemplo numérico Temos pela fórmula de ajuste que 𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1 = 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 1 𝑃 𝑍 = 1 + 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 0 𝑃 𝑍 = 0 Usando os dados da Tabela 1 𝑃 𝑍 = 1 = 87 + 270 700 = 0,51 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 1 = 81 87 = 0,93103 𝑃 𝑍 = 0 = 263 + 80 700 = 0,49 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 0 = 192 263 = 0,73004 Fórmula de ajuste: exemplo numérico Temos pela fórmula de ajuste que 𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1 = 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 1 𝑃 𝑍 = 1 + 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 0 𝑃 𝑍 = 0 Usando os dados da Tabela 1 𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1 = 0,93 × 0,51 + 0,73 × 0,49 = 0,832 Fórmula de ajuste: exemplo numérico Temos pela fórmula de ajuste que 𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 0 = 𝑃 𝑌 = 1 𝑋 = 0, 𝑍 = 1 𝑃 𝑍 = 1 + 𝑃 𝑌 = 1 𝑋 = 0, 𝑍 = 0 𝑃 𝑍 = 0 Usando os dados da Tabela 1 𝑃 𝑍 = 1 = 87 + 270 700 = 0,51 𝑃 𝑌 = 1 𝑋 = 0, 𝑍 = 1 = 234 270 = 0,86667 𝑃 𝑍 = 0 = 263 + 80 700 = 0,49 𝑃 𝑌 = 1 𝑋 = 0, 𝑍 = 0 = 55 80 = 0,6875 Fórmula de ajuste: exemplo numérico Temos pela fórmula de ajuste que 𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1 = 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 1 𝑃 𝑍 = 1 + 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 0 𝑃 𝑍 = 0 Usando os dados da Tabela 1 𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 0 = 0,87 × 0,51 + 0,69 × 0,49 = 0,7818 Fórmula de ajuste: exemplo numérico Comparando o efeito de tomar a droga (𝑋 = 1) com o efeito de não tomar (𝑋 = 0), obtemos 𝐴𝐶𝐸 = 𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1 − 𝑃 𝑌 = 1 𝑋 = 0 = 0,832 − 0,7818 = 0,0502 ACE: a diferença na fração da população que se recuperaria se todos tomassem a droga em comparação com quando ninguém toma a droga. Fórmula de ajuste: outro exemplo Exemplo de pressão sanguínea do paradoxo de Simpson Discutimos que o método mais sensível não seria condicionar a pressão arterial, mas examinar a tabela de população incondicional diretamente. Como a fórmula de ajuste poderia lidar com situações como essa? Pressão sanguínea RecuperaçãoUso do medicamento Fórmula de ajuste: outro exemplo 𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1 =? Pressão sanguínea RecuperaçãoUso do medicamento Fórmula de ajuste: outro exemplo 𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1 =? Primeiro, simulamos uma intervenção e examinamos a fórmula de ajuste resultante da intervenção simulada. Como nenhuma ligação entra em 𝑋, já que 𝑋 não tem pais, não é necessária nenhum “corte” no grafo. As condições em que os dados foram obtidos foram tais que o tratamento foi atribuído "como se fosse randomizado". Se houvesse um fator que fizesse com que os indivíduos preferissem ou rejeitassem o tratamento, esse fator deveria aparecer no modelo; a ausência de tal fator nos permite tratar 𝑋 como um tratamento aleatorizado. Sob tais condições, o grafo de intervenção é igual ao gráfico original e a fórmula de ajuste se reduz a 𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥 = 𝑃 𝑌 = 𝑦 𝑋 = 𝑥 Se ajustássemos pela pressão arterial, obteríamos uma avaliação incorreta - correspondente a um modelo em que a pressão arterial fizesse com que as pessoas buscassem tratamento.Ajustar por... Ou não ajustar? Entender qual variável, ou conjunto de variáveis, 𝑍 pode ser legitimamente incluído na Fórmula de Ajuste. O procedimento de intervenção determina que 𝑍 deve coincidir com os pais de 𝑋, porque é a influência desses pais que neutralizamos quando corrigimos 𝑋 por manipulação externa. Seja 𝑃𝐴 𝑋 os pais de 𝑋. Regra 1 (A Regra de Efeito Causal) Dado um grafo 𝐺 em que um conjunto de variáveis 𝑃𝐴 são designadas como pais de 𝑋, o efeito causal de 𝑋 em 𝑌 é dado por 𝑃(𝑌 = 𝑦|𝑑𝑜 𝑋 = 𝑥 = 𝑧 𝑃 𝑌 = 𝑦 𝑋 = 𝑥, 𝑃𝐴 = 𝑧 𝑃 𝑃𝐴 = 𝑧 onde 𝑧 varia em todas as combinações de valores que as variáveis na 𝑃𝐴 podem tomar. Regra 1 (A Regra de Efeito Causal) Outra forma de expressa a Regra 1 𝑃(𝑌 = 𝑦|𝑑𝑜 𝑋 = 𝑥 = 𝑧 𝑃 𝑌 = 𝑦 𝑋 = 𝑥, 𝑃𝐴 = 𝑧 𝑃 𝑃𝐴 = 𝑧 ∙ 𝑃 𝑋 = 𝑥|𝑃𝐴 = 𝑧 𝑃 𝑋 = 𝑥|𝑃𝐴 = 𝑧 = 𝑃 𝑦 𝑑𝑜 𝑥 = 𝑧 𝑃 𝑋 = 𝑥, 𝑌 = 𝑦, 𝑃𝐴 = 𝑧 𝑃 𝑋 = 𝑥|𝑃𝐴 = 𝑧 Escore de propensão (Propensity score) Observações Quais aspectos do grafo nos permitem prever os efeitos causais a partir de dados observacionais. Precisamos do grafo para determinar a identidade dos pais de 𝑋! 𝑋: o conjunto de fatores que, em condições não- experimentais, seria suficiente para determinar o valor de 𝑋, ou a probabilidade desse valor. Observações Na maioria dos casos práticos, o conjunto de pais de 𝑋 conterá variáveis não observadas que nos impedirão de calcular as probabilidades condicionais na Fórmula de Ajuste. Como veremos nas seções seguintes, podemos ajustar para outras variáveis no modelo para substituir os elementos não medidos de 𝑃𝐴 𝑋 . Intervenções múltiplas e a regra do produto truncado Ao derivar a Fórmula de Ajuste, assumimos uma intervenção em uma única variável, 𝑋, cujos pais foram “desconectados”, de modo a simular a ausência de sua influência após a intervenção. No entanto, em políticas sociais e médicas normalmente envolvem várias intervenções, ditando o valor de várias variáveis simultaneamente. Intervenções múltiplas e a regra do produto truncado Regra da Decomposição do Produto A distribuição antes da intervenção para o modelo abaixo é dada pelo produto 𝑃 𝑥, 𝑦, 𝑧 = 𝑃 𝑧 𝑃 𝑥 𝑧 𝑃 𝑦 𝑥, 𝑧 Intervenções múltiplas e a regra do produto truncado Considerando a distribuição pós-intervenção, representada pela figura abaixo, é dada pelo produto 𝑃 𝑧, 𝑦 𝑑𝑜 𝑥 = 𝑃𝑚 𝑧 𝑃𝑚 𝑦 𝑥, 𝑧 = 𝑃 𝑧 𝑃 𝑦 𝑥, 𝑧 Intervenções múltiplas e a regra do produto truncado 𝑃 𝑧, 𝑦 𝑑𝑜 𝑥 = 𝑃𝑚 𝑧 𝑃𝑚 𝑦 𝑥, 𝑧 = 𝑃 𝑧 𝑃 𝑦 𝑥, 𝑧 Isso coincide com a Fórmula de Ajuste, porque para avaliar 𝑃 𝑦 𝑑𝑜 𝑥 precisamos somar em 𝑧, o que dá 𝑃 𝑦 𝑑𝑜 𝑥 = 𝑧 𝑃 𝑧 𝑃 𝑦 𝑥, 𝑧 Fórmula do produto truncado ou g-fórmula Generalizando a Fórmula de Ajuste para múltiplas intervenções, ou seja, intervenções que atribui valores constantes a um conjunto de variáveis 𝑋. 𝑃 𝑥1, 𝑥2, … , 𝑥𝑛 𝑑𝑜 𝑥 = 𝑖 𝑃 𝑥𝑖 𝑝𝑎𝑖 para todo 𝑖 com 𝑋𝑖 não pertencente a 𝑋. Exemplo suponha que uma interveção seja realizada no modelo da Figura 1 fazendo 𝑋 = 𝑥 e 𝑍3 = 𝑧3. A distribuição pós-intervenção (Figura 2) das outras variáveis no modelo será 𝑃 𝑧1, 𝑧2, 𝑤, 𝑦 𝑑𝑜 𝑋 = 𝑥, 𝑍3 = 𝑧3 = 𝑃 𝑧1 𝑃 𝑧2 𝑃 𝑤 𝑥 𝑃 𝑦 𝑤, 𝑧3, 𝑧2 onde eliminamos os fatores 𝑃 𝑥 𝑧1, 𝑧3 e 𝑃 𝑧3 𝑧1, 𝑧2 do produto. Fig. 1: Modelo sem intervenção Fig. 2: Modelo com intervenção Exercício
Compartilhar