Buscar

Modelos de Grafos e suas aplicações incompleto

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 114 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 114 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 114 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Inferência Causal
Segundo Semestre de 2017 / Professores:
Augusto C. Souza; Ângela M. Coelho; Marcel T. Vieira
Grafos de Probabilidade e Suas 
Aplicações em Inferência Causal
Unidade 2
Grafos de probabilidade
 Revisão
http://dagitty.net/learn/graphs/
Grafos no R: Exercício 1.4.1
 Considere o grafo exibido na figura abaixo
 (A) Nomeie todos os pais de Z.
 (B) Nomeie todos os antepassados de Z.
 (C) Nomeie todos os filhos de W.
 (D) Nomeie todos os descendentes de W.
 (E) Desenhe todos os caminhos 
(simples) entre X e T (ou seja, nenhum 
nó deve aparecer mais de uma vez).
 (F) Desenhe todos os caminhos 
orienados entre X e T.
Introdução
 Modelos causais representam o mecanismo pelo 
qual os dados foram gerados.
 Dado um modelo causal verdadeiramente completo 
para, digamos, os resultados dos exames de matemática 
do ensino médio e dado uma lista completa de valores 
para cada variável exógena desse modelo, podemos, 
teoricamente, gerar um ponto de dados (ou seja, um 
resultado de teste) para qualquer indivíduo.
Introdução
 Modelos causais representam o mecanismo pelo 
qual os dados foram gerados.
 Poderíamos, em vez disso, 
ter uma distribuição de probabilidade que 
caracterizasse as variáveis exógenas,
nos permitiria gerar uma distribuição de pontuações 
do teste
Introdução
 E se não tivermos nem um modelo causal probabilisticamente 
especificado, mas apenas uma estrutura gráfica do modelo?
 Sabemos quais variáveis são causadas por outras variáveis, mas 
não conhecemos a força ou a natureza dos relacionamentos. 
 Mesmo com informações tão limitadas, podemos discernir 
muito sobre o conjunto de dados gerado pelo modelo. 
 A partir de um modelo causal gráfico não especificado
podemos aprender quais variáveis no conjunto de dados são 
independentes entre si e quais são independentes uma da outra 
condicionadas a outras variáveis. 
Essas independências serão verdadeiras para cada conjunto 
de dados gerado por um modelo causal com essa estrutura 
gráfica, independentemente das funções específicas de um 
SCM.
Modelo Estrutural 
Causal (SCM)
Cenários
1.
 financiamento do ensino médio em dólares (𝑋)
 escore SAT médio (𝑌) 
 taxa de aceitação da faculdade (𝑍) para um 
determinado ano.
2.
 o estado de um interruptor de luz (𝑋), 
 o estado de um circuito elétrico associado (𝑌)
 o estado de uma lâmpada (𝑍).
3.
1. horas que os participantes de uma corrida à pé 
trabalham em seus empregos a cada semana 
(𝑋), 
2. horas que os participantes dedicam ao 
treinamento a cada semana (𝑌)
3. tempo de conclusão, em minutos, que os 
participantes conseguem na corrida (𝑍).
Modelo Estrutural 
Causal (SCM)
 Variáveis exógenas – 𝑈𝑋, 𝑈𝑌, 𝑈𝑍
 são válidas para quaisquer efeitos 
desconhecidos ou aleatórios que possam alterar 
a relação entre as variáveis endógenas.
Modelo Estrutural 
Causal (SCM)
1. Financiamento educacional
𝑉 = 𝑋, 𝑌, 𝑍
𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍
𝐹 = 𝑓𝑋, 𝐹𝑌, 𝐹𝑍
𝑓𝑋 ∶ 𝑋 = 𝑈𝑋
𝑓𝑌 ∶ 𝑌 =
𝑥
3
+ 𝑈𝑌
𝑓𝑍 ∶ 𝑍 =
𝑦
16
+ 𝑈𝑍
Modelo Estrutural 
Causal (SCM)
1. Circuito Elétrico
𝑉 = 𝑋, 𝑌, 𝑍
𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍
𝐹 = 𝑓𝑋, 𝐹𝑌 , 𝐹𝑍
𝑓𝑋 ∶ 𝑋 = 𝑈𝑋
𝑓𝑌 ∶ 𝑌
= 
𝐹𝑒𝑐ℎ𝑎𝑑𝑜 𝑆𝐸 𝑋 = 𝑜𝑛 𝐸 𝑈𝑌 = 0 𝑂𝑈 𝑋 = 𝑜𝑓𝑓 𝐸 𝑈𝑌 = 1
𝐴𝑏𝑒𝑟𝑡𝑜, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
𝑓𝑍 ∶ 𝑍
= 
𝐹𝑒𝑐ℎ𝑎𝑑𝑜 𝑆𝐸 𝑋 = 𝑜𝑛 𝐸 𝑈𝑌 = 0 𝑂𝑈 𝑋 = 𝑜𝑓𝑓 𝐸 𝑈𝑌 = 1
𝐴𝑏𝑒𝑟𝑡𝑜, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
Modelo Estrutural 
Causal (SCM)
1. Corrida
𝑉 = 𝑋, 𝑌, 𝑍
𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍
𝐹 = 𝑓𝑋, 𝐹𝑌, 𝐹𝑍
𝑓𝑋 ∶ 𝑋 = 𝑈𝑋
𝑓𝑌 ∶ 𝑌 = 84 − 𝑥 + 𝑈𝑌
𝑓𝑍 ∶ 𝑍 =
100
𝑦
+ 𝑈𝑍
Independência em SCM
 Nenhum dos SCM anteriores compartilha quaisquer 
funções em comum. 
 Mas porque eles compartilham uma estrutura gráfica 
comum, 
os conjuntos de dados gerados por todos os três 
SCMs devem compartilhar certas independências.
Dependência e Independência em SCM
 As independências compartilhadas pelos conjuntos 
de dados gerados por esses três SCMs e as 
dependências provavelmente compartilhadas por 
todos esses SCMs são:
1. 𝑍 e 𝑌 são dependentes
Para algum 𝑧, 𝑦, 𝑃 𝑍 = 𝑧|𝑌 = 𝑦 ≠ 𝑃 𝑍 = 𝑧
2. 𝑌 e 𝑋 são dependentes
Para algum 𝑦, 𝑥, 𝑃 𝑌 = 𝑦 𝑋 = 𝑥 ≠ 𝑃 𝑌 = 𝑦
3. 𝑍 e 𝑋 são provavelmente dependentes
Para algum 𝑧, 𝑥, 𝑃 𝑍 = 𝑧 𝑋 = 𝑥 ≠ 𝑃 𝑍 = 𝑧
4. 𝑍 e 𝑋 são independentes, condicionados em 𝑌
Para todo 𝑥, 𝑦, 𝑧, 
𝑃 𝑍 = 𝑧 𝑋 = 𝑥, 𝑌 = 𝑦 = 𝑃 𝑍 = 𝑧 𝑌 = 𝑦
Dependência e 
Independência em 
SCM
 Observações
 Quaisquer duas variáveis, com uma 
ligação entre elas, são dependentes.
 Em qualquer modelo causal, 
independentemente das funções 
específicas, duas variáveis conectadas por 
uma ligação são dependentes.
 Se Z depende de 𝑌 e 𝑌 depende de 
𝑋, então por quê 𝑍 é “provavelmente” 
depende de 𝑋?
Dependência e Independência em SCM
 Casos patológicos: casos intransitivos
𝑉 = 𝑋, 𝑌, 𝑍
𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍
𝐹 = 𝑓𝑋, 𝐹𝑌, 𝐹𝑍
𝑓𝑋 ∶ 𝑋 = 𝑈𝑋
𝑓𝑌 ∶ 𝑌 = 
𝑎
𝑏
𝑐
𝑠𝑒 𝑋 = 1 𝑒 𝑈𝑌 = 1
𝑠𝑒 𝑋 = 2 𝑒 𝑈𝑌 = 2
𝑠𝑒 𝑈𝑌 = 2
𝑓𝑍 ∶ 𝑍 = 
𝑖
𝑗
𝑠𝑒 𝑌 = 𝑐 𝑜𝑢 𝑈𝑍 = 1
𝑠𝑒 𝑈𝑍 = 2
Dependência e 
Independência em 
SCM
 Observações
 Caso 4: 𝑍 e 𝑋 são independentes 
condicionais em 𝑌.
 Considere que 𝑌 = 𝑎. 
Queremos saber se, somente nesses 
casos, o valor de 𝑍 é independente do 
valor de 𝑋.
 Examinando apenas os casos em que 
𝑌 = 𝑎, 
 quando selecionamos casos com valores 
diferentes de 𝑋, o valor de 𝑈𝑌 muda de 
modo a manter 𝑌 em 𝑌 = 𝑎.
 mas como 𝑍 depende apenas de 𝑌 e 𝑈𝑍, e 
não de 𝑈𝑌, o valor de 𝑍 permanece
inalterado. 
 selecionar um valor diferente de 𝑋 não altera 
o valor de 𝑍.
Então X é independente de Z, 
condicional em Y.
Grafos em Cadeia
 Regra 1: Independência condicional em cadeias
Duas variáveis, 𝑋 e 𝑌, são 
condicionalmente independentes, dado 
𝑍, se houver apenas um caminho 
unidirecional entre 𝑋 e 𝑌 e Z é qualquer
conjunto de variáveis que esteja nesse
caminho.
Grafos em Cadeia
 Regra 1: Observações
1. Dadas quaisquer duas variáveis 𝑋 e 𝑌, se o único 
caminho entre 𝑋 e 𝑌 é composto inteiramente de
cadeias, então 𝑋 e 𝑌 são independentes condicionais 
em qualquer variável intermediária nesse caminho.
2. Esta relação de independência se mantém 
independentemente das funções que conectam as 
variáveis.
3. A Regra 1 só vale quando assumimos que os 
termos de erro 𝑼𝑿, 𝑼𝒀 e 𝑼𝒁 são independentes um 
do outro.
SCM em forma de 
Grafo
Cenários
1. Temperatura, vendas de sorvete e crime
 A temperatura do dia em uma cidade, em graus 
Celsius (𝑋), 
 O número de vendas em uma sorveteria local 
nesse dia (𝑌) e 
 O número de crimes violentos na cidade nesse dia 
(Z). 
𝑉 = 𝑋, 𝑌, 𝑍 𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍
𝐹 = 𝑓𝑋, 𝐹𝑌 , 𝐹𝑍
𝑓𝑋 ∶ 𝑋 = 𝑈𝑋
𝑓𝑌 ∶ 𝑌 = 4𝑥 + 𝑈𝑌
𝑓𝑍 ∶ 𝑍 =
𝑥
10
+ 𝑈𝑍
SCM em forma de 
Grafo
Cenários
1. Interruptor e duas lâmpadas
 O estado (para cima ou para baixo) de um 
interruptor (𝑋), 
 o estado (ligada ou desligada) de uma lâmpada 
(𝑌) e 
 o estado (ligada ou desligada) de uma segunda 
lâmpada (𝑍) 
𝑉 = 𝑋, 𝑌, 𝑍 𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍
𝐹 = 𝑓𝑋, 𝐹𝑌, 𝐹𝑍
𝑓𝑋 ∶ 𝑋 = 𝑈𝑋
𝑓𝑌 ∶ 𝑌
= 
𝐿𝑖𝑔𝑎𝑑𝑎 𝑆𝐸 𝑋 = 𝑐𝑖𝑚𝑎 𝐸 𝑈𝑌 = 0 𝑂𝑈 𝑋 = 𝑏𝑎𝑖𝑥𝑜 𝐸 𝑈𝑌 = 1
𝐷𝑒𝑠𝑙𝑖𝑔𝑎𝑑𝑎, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
𝑓𝑍 ∶ 𝑍
= 
𝐿𝑖𝑔𝑎𝑑𝑎 𝑆𝐸 𝑋 = 𝑐𝑖𝑚𝑎 𝐸 𝑈𝑌 = 0 𝑂𝑈 𝑋 = 𝑏𝑎𝑖𝑥𝑜 𝐸 𝑈𝑌 = 1
𝐷𝑒𝑠𝑙𝑖𝑔𝑎𝑑𝑎, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
Dependência e Independênciaem SCM em 
formato de Garfo
 Se assumirmos que os termos de erro 𝑈𝑋, 𝑈𝑌 e 𝑈𝑍 são
independentes, então, examinando o modelo gráfico 
podemos determinar que os SCMs acima compartilham 
as seguintes dependências e independências:
1. 𝑋 e 𝑌 são dependentes
Para algum 𝑥, 𝑦, 𝑃 𝑍 = 𝑥|𝑌 = 𝑦 ≠ 𝑃 𝑋 = 𝑥
2. 𝑋 e 𝑍 são dependentes
Para algum 𝑥, 𝑧, 𝑃 𝑋 = 𝑥 𝑍 = 𝑧 ≠ 𝑃 𝑋 = 𝑥
3. 𝑍 e 𝑌 são provavelmente dependentes
Para algum 𝑧, 𝑦, 𝑃 𝑍 = 𝑧 𝑌 = 𝑦 ≠ 𝑃 𝑍 = 𝑧
4. 𝑌 e 𝑍 são independentes, condicionados em 𝑋
Para todo 𝑥, 𝑦, 𝑧, 
𝑃 𝑌 = 𝑦 𝑍 = 𝑧, 𝑋 = 𝑥 = 𝑃 𝑌 = 𝑦 𝑋 = 𝑥
Dependência e 
Independência em 
SCM em formato 
de Garfo
 Observações
 Os pontos 1 e 2 seguem, mais uma 
vez, o fato de que 𝑌 e 𝑍 estão 
diretamente conectados a 𝑋 por uma 
seta.
 Se 𝑌 muda quando 𝑋 muda e 𝑍
também muda quando 𝑋 muda, então 
é provável (embora não seja certo) 
que 𝑌 muda junto com 𝑍 e vice-versa.
Assim sendo,
 Uma vez que uma alteração no valor 
de 𝑌 nos dá informações sobre uma 
alteração associada no valor de 𝑍, 𝑌 e
𝑍 são provavelmente variáveis 
dependentes.
Dependência e 
Independência em 
SCM em formato 
de Garfo
 Observações
 Como o 𝑋 não muda, os valores de 𝑌
e 𝑍 não mudam de acordo com 𝑋 –
eles mudam apenas em resposta a 𝑈𝑌
e 𝑈𝑍, que assumimos ser 
independentes. 
 Portanto, quaisquer alterações 
adicionais nos valores de 𝑌 e 𝑍
devem ser independentes uma da 
outra.
Grafos em Garfo
 Se duas variáveis compartilham uma causa comum, e se 
essa causa comum faz parte do único caminho entre 
elas, então o raciocínio análogo ao acima nos diz que 
essas dependências e independências condicionais são 
verdadeiras para essas variáveis.
 Regra 2 (Independência condicional em Garfos) 
Se uma variável 𝑋 é uma causa comum 
das variáveis 𝑌 e 𝑍 e existe apenas um 
caminho entre 𝑌 e 𝑍, então 𝑌 e 𝑍 são 
independentes condicionais em 𝑋.
Colisão (colliders)
 A versão mais simples de um grafo de colisão ocorre 
quando um vértice recebe setas de outros dois 
vértices.
Grafo de 
Colisão
 Relações de dependência e 
independência
1. 𝑋 e 𝑍 são dependentes.
Para alguns 𝑥, 𝑧, 
𝑃 𝑋 = 𝑥 𝑍 = 𝑧 ≠ 𝑃 𝑋 = 𝑥
2. 𝑌 e 𝑍 são dependentes.
Para alguns 𝑦, 𝑧, 
𝑃 𝑌 = 𝑦 𝑍 = 𝑧 ≠ 𝑃 𝑌 = 𝑦
3. 𝑋 e 𝑌 são independentes.
Para todo 𝑥, 𝑦, 
𝑃 𝑋 = 𝑥 𝑌 = 𝑦 = 𝑃 𝑋 = 𝑥
4. 𝑋 e 𝑌 são dependentes condicionais 
em 𝑍.
Para alguns 𝑥, 𝑦, 𝑧, 
𝑃(𝑋 = 𝑥|𝑌 = 𝑦, 𝑍 = 𝑧) ≠ 𝑃 (𝑋 = 𝑥|𝑍 = 𝑧)
Grafo de 
Colisão
 Relações de dependência e 
independência
1. 𝑋 e 𝑍 são dependentes.
Para alguns 𝑥, 𝑧, 
𝑃 𝑋 = 𝑥 𝑍 = 𝑧 ≠ 𝑃 𝑋 = 𝑥
2. 𝑌 e 𝑍 são dependentes.
Para alguns 𝑦, 𝑧, 
𝑃 𝑌 = 𝑦 𝑍 = 𝑧 ≠ 𝑃 𝑌 = 𝑦
A veracidade dos dois primeiros 
pontos foi estabelecida anteriormente
Grafo de 
Colisão
 Relações de dependência e 
independência
3. 𝑋 e 𝑌 são independentes.
Para todo 𝑥, 𝑦, 
𝑃 𝑋 = 𝑥 𝑌 = 𝑦 = 𝑃 𝑋 = 𝑥
 Nem 𝑋 nem 𝑌 são descendentes
ou antepassados um do outro, nem 
dependem da mesma variável. 
 Eles respondem apenas a 𝑈𝑋 e 𝑈𝑌,
que são considerados independentes, 
portanto, 
não há mecanismo causal pelo qual 
as variações no valor de 𝑋 devem 
estar associadas a variações no 
valor de 𝑌.
Grafo de 
Colisão
 Relações de dependência e 
independência
4. 𝑋 e 𝑌 são dependentes condicionais 
em 𝑍.
Para alguns 𝑥, 𝑦, 𝑧, 
𝑃(𝑋 = 𝑥|𝑌 = 𝑦, 𝑍 = 𝑧) ≠ 𝑃 (𝑋 = 𝑥|𝑍 = 𝑧)
Por que duas variáveis 
independentes de repente se 
tornariam dependentes quando 
condicionamos ao efeito de cada 
uma, que é comum?
Grafo de 
Colisão
 Relações de dependência e 
independência
4. 𝑋 e 𝑌 são dependentes condicionais 
em 𝑍.
Para alguns 𝑥, 𝑦, 𝑧, 
𝑃(𝑋 = 𝑥|𝑌 = 𝑦, 𝑍 = 𝑧) ≠ 𝑃 (𝑋 = 𝑥|𝑍 = 𝑧)
Como 𝑍 depende, para o seu valor, 
de 𝑋 e 𝑌, ao comparar casos em que 
Z assume, por exemplo, o valor 𝑎,
qualquer alteração no valor de 𝑋
deve ser compensada por uma 
alteração no valor de 𝑌 – caso 
contrário, o valor de 𝑍 também 
mudaria.
Grafo de 
Colisão
 Relações de dependência e 
independência
4. 𝑋 e 𝑌 são dependentes condicionais 
em 𝑍.
Para alguns 𝑥, 𝑦, 𝑧, 
𝑃(𝑋 = 𝑥|𝑌 = 𝑦, 𝑍 = 𝑧) ≠ 𝑃 (𝑋 = 𝑥|𝑍 = 𝑧)
De um modo geral,
O condicionamento em um vértice de 
colisão produz uma dependência 
entre os pais do vértice
Exemplo 1
 Suponha que uma certa faculdade dê bolsas de 
estudo a dois tipos de alunos: 
 aqueles com talentos musicais extraordinários e 
 aqueles com notas médias extraordinárias.
 Estes dois traços são independentes?
 Se você encontrar alguém que tenha recebido uma 
bolsa nesta faculdade muda alguma coisa? 
 Nesta situação, saber que o bolsista não possui nenhum 
talento musical, nos informa o que...
Exemplo 2
 Considere o lançamento simultâneo (independente) 
de duas moedas honestas e um sino que toca 
sempre que pelo menos uma das moedas caia com 
a face “cara” voltada para cima
 Sejam os resultados das duas moedas denotados 
por 𝑋 e 𝑌, respectivamente, e seja 𝑍 o estado do
sino, com 𝑍 = 1 representando “o sino toca” e 𝑍 = 0
representando o silêncio.
Exemplo 2
 Se assumirmos que ouvimos o toque da sino, a 
probabilidade de que a moeda 1 dê cara muda se 
descobrimos que a moeda 2 também deu cara?
Exemplo 2
 Se assumirmos que ouvimos o toque da sino, a 
probabilidade de que a moeda 1 dê cara muda se 
descobrimos que a moeda 2 também deu cara?
 Considere as seguintes probabilidades iniciais:
𝑿 𝒀 𝒁 𝑷 𝑿, 𝒀, 𝒁
Cara Cara 1 0,25
Cara Coroa 1 0,25
Coroa Cara 1 0,25
Coroa Coroa 0 0,25
Exemplo 2
 𝑋 e 𝑌 são independents
𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑌 = “𝐶𝑎𝑟𝑎” =
𝑃 𝑋 = “𝐶𝑜𝑟𝑜𝑎” 𝑌 = “𝐶𝑜𝑟𝑜𝑎” =
1
2
 Agora, vamos condicionar em 𝑍 = 1 e 𝑍 = 0
Exemplo 2
 Condicionado em 𝑍 = 1 e 𝑍 = 0
𝑿 𝒀 𝑷 𝑿, 𝒀 𝒁 = 𝟏
Cara Cara 0,333
Cara Coroa 0,333
Coroa Cara 0,333
Coroa Coroa 0
𝑿 𝒀 𝑷 𝑿, 𝒀 𝒁 = 𝟎
Cara Cara 0
Cara Coroa 0
Coroa Cara 0
Coroa Coroa 1
Exemplo 2
 Se assumirmos que ouvimos o toque da sino, a 
probabilidade de que a moeda 1 dê cara muda se 
descobrimos que a moeda 2 também deu cara?
𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑍 = 1 =
1
3
+
1
3
=
2
3
𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑌 = “𝐶𝑎𝑟𝑎”, 𝑍 = 1 =
1
2
Grafo de colisão com descendentes
 Assim como condicionar em um vértice de colisão 
torna as variáveis anteriormente independentes em 
dependentes, o condicionamento em qualquer 
descendente de um vértice de colisão também os 
torna dependentes.
Grafo de colisão 
com descendentes
 Retornemos ao exemplo das 
moedas e do sino:
 Suponhamos que não ouvimos 
diretamente o sino, mas contamos 
com o relato de uma testemunha que 
é pouco confiável; 
 sempre que a campainha não toca, há 
50% de chance de que nossa 
testemunha fale falsamente que a 
campainha tocou. 
 Seja 𝑊 o relato da testemunha.
Grafo de colisão 
com descendentes
 Probabilidades para todas as 
combinações de 𝑋, 𝑌 e 𝑊
𝑿 𝒀 𝑾 𝑷 𝑿, 𝒀,𝑾
Cara Cara 1 0,25
Cara Coroa 1 0,25
Coroa Cara 1 0,25
Coroa Coroa 1 0,125
Coroa Coroa 0 0,125
Grafo de colisão 
com descendentes
 Podemos verificar que
𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑌 = “𝐶𝑎𝑟𝑎” = 𝑃 𝑋 = “𝐶𝑎𝑟𝑎”
= 1/2
e
𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑊 = 1
=
0,25 + 0,25
0,25 + 0,25 + 0,25 + 0,125
=
0,5
0,85
e
𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑌 = "𝐶𝑎𝑟𝑎",𝑊 = 1
=
0,25
0,25 + 0,25
= 0,5 <
0,5
0,85
Grafos de Colisão
 Regra 3 (Dependência condicional em colisões)
Se uma variável 𝑍 é um vértice de colisão 
entreduas variáveis 𝑋 e 𝑌, e existe apenas 
um caminho entre 𝑋 e 𝑌, então 𝑋 e 𝑌 são
incondicionalmente independentes, mas 
dependentes condicionais em 𝑍 e em 
qualquer descendente de 𝑍.
Grafos de Colisão
 Observações
 A regra 3 é extremamente importante para o estudo da 
causalidade. 
 Veremos que esta regra nos permite testar se um modelo 
causal poderia ter gerado um conjunto de dados, 
 Descobrir modelos a partir de dados e 
 resolver totalmente o Paradox de Simpson, determinando quais 
variáveis a serem medidas e como estimar os efeitos causais 
sob variáveis de confusão.
Exercício - Solução
Regras básicas
 Regra 1: Independência condicional em cadeias
 Duas variáveis, 𝑋 e 𝑌, são condicionalmente independentes, dado 
𝑍, se houver apenas um caminho unidirecional entre 𝑋 e 𝑌 e Z é
qualquer conjunto de variáveis que esteja nesse caminho.
 Regra 2 (Independência condicional em Garfos)
 Se uma variável 𝑋 é uma causa comum das variáveis 𝑌 e 𝑍 e 
existe apenas um caminho entre 𝑌 e 𝑍, então 𝑌 e 𝑍 são 
independentes condicionais em 𝑋.
 Regra 3 (Dependência condicional em colisões)
 Se uma variável 𝑍 é um vértice de colisão entre duas 
variáveis 𝑋 e 𝑌, e existe apenas um caminho entre 𝑋 e 𝑌, 
então 𝑋 e 𝑌 são incondicionalmente independentes, mas 
dependentes condicionais em 𝑍 e em qualquer descendente 
de 𝑍.
d-separação (d-separation)
 Na maioria dos modelos gráficos, os pares de 
variáveis serão conectados por vários caminhos 
possíveis e cada um desses caminhos irá passar 
por uma variedade de cadeias, garfos e colisões.
Existe um critério ou processo que pode ser aplicado 
a um modelo causal gráfico de qualquer complexidade 
para prever dependências compartilhadas por todos 
os conjuntos de dados gerados por esse gráfico?
d-separação (d-separation)
 É construída de acordo com as regras estabelecidas 
anteriormente.
 d-separação (o d significa “directional”)
 nos permite determinar, para qualquer par de 
vértices, se os vértices são 
 d-conectados, o que significa que existe um caminho de 
conexão entre eles, ou
 Os vértices são, provavelmente, dependentes. (casos 
intrasitivos)
 d-separados, o que significa que não existe esse 
caminho.
 as variáveis que os vértices representam são definitivamente 
independentes
d-separação (d-separation)
 Observações
 Dois vértices 𝑋 e 𝑌 são d-separados se todos os
caminhos entre eles (se existir algum) estiverem 
bloqueados. 
 Se mesmo apenas um caminho entre 𝑋 e 𝑌 for desbloqueado,
𝑋 e 𝑌 são d-conectados.
 Existem certos tipos de vértices que podem bloquear um 
caminho, dependendo se estamos executando uma d-
separação incondicional ou condicional.
 Se não estamos condicionando em qualquer variável, então 
apenas as colisões podem bloquear um caminho.
Então, se cada caminho entre dois vértices 𝑋 e 𝑌 tiver uma 
colisão, 𝑋 e 𝑌 não podem ser incondicionalmente dependentes; 
eles devem ser marginalmente independentes.
d-separação (d-separation)
 Observações
 Se, no entanto, estamos condicionando em um conjunto 
de vértices 𝑍, então os seguintes tipos de vértices podem 
bloquear um caminho:
 Uma colisão que não está condicionada (isto é, não 
está em 𝑍), e que não possui descendentes em 𝑍.
 Uma cadeia ou garfo cujo vértice central está em 𝑍.
Justificativas
 Se um vértice de colisão não está no conjunto de 
condicionamento 𝑍, 
 então a dependência é bloqueada; (independência)
 mas, se vértice de colisão, ou seus descendentes, está 
no conjunto de condicionamento, 
 então, a dependência está presente.
 Por outro lado, a dependência pode passar através de 
cadeias e garfos - mas as Regras 1 e 2 nos dizem que
 quando cadeias e garfos são condicionados, as variáveis em 
cada extremidade desses caminhos tornam-se independentes 
(quando consideramos um caminho por vez). 
 Portanto, qualquer vértice de não-colisão no conjunto de 
condicionamento bloquearia a dependência, enquanto 
que um que não está no conjunto de condicionamento 
permitiria a dependência.
Definição geral da d-separação
Um caminho 𝒑 é bloqueado por um conjunto de vértices 𝒁
se, e somente se, 1:
1. 𝑝 contém uma cadeia de vértices A → B → C ou um garfo A 
← B → C tal que o vértice do meio, B, está em 𝑍 (ou seja, 𝑝
está condicionado em 𝐵), ou
2. 𝑝 contém uma colisão A → B ← C tal que o vértice de 
colisão B não está em 𝑍, e nenhum descendente de B está 
em 𝑍.
Se 𝑍 bloquear todos os caminhos entre dois nós 𝑋 e 𝑌, então 𝑋
e 𝑌 são d-separados, condicionais em 𝑍 e, portanto, são 
independentes em 𝑍.
 caminho bloqueado = variáveis independentes
Exemplo 1
 Observações
 Este grafo pode estar associado a 
qualquer modelo causal. 
 As variáveis podem ser discretas, 
contínuas ou uma mistura das duas. 
 As relações entre eles podem ser 
lineares, exponenciais ou qualquer 
outra relação. 
 Independentemente do modelo, no 
entanto, 
a d-separação sempre proporcionará 
o mesmo conjunto de 
independências nos dados que o 
modelo gera.
Exemplo 1
 Considere a relação entre 𝑍 e 𝑌.
 Usando um conjunto de 
condicionamento vazio, 𝑍 = ,
eles são d-separados, o que nos 
diz que 𝑍 e 𝑌 são 
incondicionalmente independentes.
 Por quê?
Exemplo 1
 Considere a relação entre 𝑍 e 𝑌.
 Usando um conjunto de 
condicionamento vazio, 𝑍 = ,
eles são d-separados, o que nos 
diz que 𝑍 e 𝑌 são 
incondicionalmente 
independentes.
 Por quê?
 Existe apenas um caminho entre 𝑍 e
𝑌 e esse caminho é bloqueado por
uma colisão (Z → W ← X).
Exemplo 1
 Considere a relação entre 𝑍 e 𝑌.
 Suponha, agora, que condicionamos 
o caminho em 𝑊.
 As regras da d-separação nos diz 
que 𝑍 e Y são d-conectados, 
condicionado em 𝑊.
 Por quê?
Exemplo 1
 Considere a relação entre 𝑍 e 𝑌.
 Suponha, agora, que condicionamos o 
caminho em 𝑊.
 As regras da d-separação nos diz que 
𝑍 e Y são d-conectados
(dependentes), condicionado em 𝑊.
 Por quê?
 Neste caso em que o conjunto de 
condicionamento é 𝑊 e tem um único 
caminho entre 𝑍 e 𝑌que contém um garfo 
(𝑋) que não está no conjunto 𝑊 , e o 
único vértice de colisão (𝑊) no caminho
está nesse conjunto, esse caminho não
está bloqueado. 
 O mesmo é verdade se condicionarmos em 
𝑈, porque 𝑈 é um descendente de uma 
colisão ao longo do caminho entre 𝑍 e 𝑌.
Exemplo 1
 Considere a relação entre 𝑍 e 𝑌.
 Considere, agora, que condicionamos 
o caminho ao conjunto 𝑊,𝑋 , 
 𝑍 e 𝑌 continuam dependentes?
Exemplo 1
 Considere a relação entre 𝑍 e 𝑌.
 Considere, agora, que condicionamos o 
caminho ao conjunto 𝑊,𝑋 , 
 𝑍 e 𝑌 continuam dependentes?
 Existe agora no caminho em ter 𝑍 e 𝑌 um 
vértice não-colisor (𝑋) que está no
conjunto de condicionamento. 
 Embora 𝑊 tenha sido desbloqueado por
condicionamento, um vértice bloqueado
é suficiente para bloquear todo o
caminho. 
Uma vez que o único caminho entre 𝑍 e
𝑌 está bloqueado por este conjunto de 
condicionamento, 𝑍 e 𝑌 são 𝑑-
separados condicionados em {𝑊, 𝑋}.
Exemplo 2
 Agora 𝑍 e 𝑌 agora são 
incondicionalmente 
dependentes.
 Por quê?
Exemplo 2
 Agora 𝑍 e 𝑌 agora são 
incondicionalmente 
dependentes.
 Por quê?
Porque há um caminho entre eles 
(Z ← T → Y) que não contém 
colisões.
Exemplo 2
 Condicionando o caminho em 𝑇
 O que acontece?
Exemplo 2
 Condicionando o caminho em 𝑇
 O que acontece?
Esse caminho fica bloqueado e 𝑍 e 𝑌
tornam-se independentes
novamente
Exemplo 2
 Condicionando o caminho em 𝑇
 O que acontece?
Esse caminho fica bloqueadoe 𝑍 e 𝑌
tornam-se independentes
novamente
 Condicionando o caminho em 
𝑇,𝑊
Exemplo 2
 Condicionando o caminho em 𝑇
 O que acontece?
Esse caminho fica bloqueado e 𝑍 e 𝑌
tornam-se independentes
novamente
 Condicionando o caminho em 
𝑇,𝑊
Torna-os conectados novamente 
(dependentes).
O condicionamento em 𝑇 bloqueia o caminho Z
← T → Y, mas o condicionamento em 𝑊
desbloqueia o caminho Z → W ← X → Y.
Exemplo 2
 Condicionando o caminho em 
𝑇,𝑊, 𝑋
 O que acontece?
Exemplo 2
 Condicionando o caminho em 
𝑇,𝑊, 𝑋
 O que acontece?
𝑍 e 𝑌 tornam-se independentes
novamente!
 Por quê?
Exemplo 2
 Resumo
𝑍 e 𝑌 são d-conectados (e, portanto, 
provavelmente dependentes) 
condicionais em 
𝑊, U, 𝑊,𝑈 , 𝑊,𝑇 , 𝑈, 𝑇 , 𝑊,𝑈, 𝑇 , 
𝑊,𝑋 , 𝑈, 𝑋 e {𝑊,𝑈, 𝑋}.
Eles são 𝑑-separados (e, portanto, 
independentes) em 
𝑇, 𝑋, 𝑇 , 𝑊,𝑋, 𝑇 , 𝑈, 𝑋, 𝑇 e 
𝑊,𝑈, 𝑋, 𝑇 .
Exemplo 2
 Observação
Eles são 𝑑-separados (e, portanto, 
independentes) em 
𝑇, 𝑋, 𝑇 , 𝑊,𝑋, 𝑇 , 𝑈, 𝑋, 𝑇 e 𝑊,𝑈, 𝑋, 𝑇 .
Observe que 𝑇 está em cada conjunto 
de condicionamento que d-separa 𝑍 e 𝑌;
Isso é porque 𝑇 é o único vértice em um 
caminho que incondicionalmente 𝑑-
conecta 𝑍 e 𝑌, então, a menos que o 
caminho esteja condicionado, 𝑍 e 𝑌
sempre serão 𝑑-conectados.
Exercício
Teste de modelo e pesquisa causal
 Vimos que modelos causais têm implicações testáveis 
nos conjuntos de dados que geram.
 se tivermos um grafo 𝐺 que acreditamos que poderia ter 
gerado um conjunto de dados 𝑆, a 𝑑-separação nos indicará 
quais variáveis em 𝐺 devem ser condicionalmente 
independentes sobre quais outras variáveis.
 Como isso funciona?
 Suponhamos que listamos as condições de d-separação em 𝐺 e 
notamos que as variáveis 𝐴 e 𝐵 devem ser independentes 
condicionais em 𝐶. 
 Suponha, agora, que estimemos as probabilidades com base em 𝑆
e descobrimos que os dados sugerem que 𝐴 e 𝐵 não são 
independentes condicionais em 𝐶. 
Podemos então rejeitar 𝐺 como um possível 
modelo causal para 𝑆.
Exemplo
 Considerando que 𝑊 e 𝑍1 são
independentes, dado 𝑋.
 Suponha que regredimos 𝑊 em 𝑋
e 𝑍1. 
𝑤 = 𝑎𝑥 + 𝑏𝑧1
 Se, ao avaliarmos o modelo, 
verificar-mos que 𝑏 não é igual a
zero, 
sabemos que 𝑊 depende de 𝑍1 dado 
𝑋 e, conseqüentemente, que o 
modelo está errado.
Exemplo
 Observações
 Neste caso, sabemos também onde 
está errado; 
o modelo (grafo) causal verdadeiro deve 
ter um caminho entre 𝑊 e 𝑍1 que não 
seja d-separado por 𝑋.
 Este é um resultado teórico que é 
válido para todos os modelos 
acíclicos com erros independentes 
 Cada condição de separação do 
modelo corresponde a uma 
independência condicional nos dados, 
nenhum outro teste pode refutar o 
modelo.
Método tradicional de teste de ajuste de um 
modelo
 Teste de hipóteses estatísticas de todo o modelo
 avaliamos o quão provável é que a amostra observada 
tenham sido gerada pelo modelo proposto na hipótese, 
ao contrário de ter ocorrido por pura chance.
 Isso pode ser feito (aproximadamente) assumindo 
 um modelo linear e gaussiano, 
 Como, 
 sob tais pressupostos, a distribuição da conjunta pode ser 
expressa sucintamente em termos dos parâmetros do modelo, 
e podemos então avaliar a probabilidade de que as amostras 
observadas tenham sido geradas pelo modelo totalmente 
parametrizado.
Método tradicional de teste de ajuste de um 
modelo
 Questões importantes
1. Se algum parâmetro não puder ser estimado, a 
distribuição conjunta não pode ser estimada e o modelo 
não pode ser testado.
 Os termos de erro estão correlacionados ou algumas das 
variáveis não são observadas.
2. Modelo testado globalmente.
 Dificuldade de identificar o motivo da falta de ajuste.
3. Quando testamos um modelo de forma global, o número 
de variáveis envolvidas pode ser grande e, se houver 
erro de mensuração / ou uma variação amostral 
associada a cada variável, o teste não será confiável.
Vantagens da d-separação
1. É não-paramétrico
 não depende das funções específicas que conectam 
variáveis.
2. Testa modelos localmente, em vez de globalmente.
 permite identificar pontos específicos onde nosso modelo 
apresenta problemas e repará-los.
Classes de equivalência de DAG
 classe de equivalência: conjunto de grafos com 
implicações indistinguíveis. 
 Dois grafos 𝐺1 e 𝐺2 estão na mesma classe de 
equivalência se 
 compartilham as mesmas ligações, independentemente da 
direção e se 
 compartilham vértices de colisão cujos pais não são adjacente 
(v-estrutura).
Quaisquer dois grafos que satisfaçam este critério têm 
conjuntos idênticos de condições de d-separação e, 
portanto, conjuntos idênticos de implicações testáveis.
Classes de equivalência de DAG
 A importância desse resultado é que nos permite 
pesquisar um conjunto de dados para os modelos 
causais que poderiam tê-lo gerado. 
 Assim, não só podemos começar com um modelo 
causal e gerar um conjunto de dados, mas também 
podemos começar com um conjunto de dados e 
buscar a um modelo causal que o explique.
Os Efeitos das Intervenções
O objetivo final de muitos estudos estatísticos é prever os efeitos das 
intervenções.
 Características de incêndios florestais X frequência de incêndios
 Quando coletamos dados sobre fatores associados a incêndios florestais, 
estamos realmente procurando por algo que possamos intervir para 
diminuir a frequência do incêndio. 
 Fármaco contra o câncer X estado de saúde de um paciente
 Quando realizamos um estudo sobre um novo fármaco contra o câncer, 
estamos tentando identificar como a doença de um paciente responde 
quando intervimos medicando o paciente. 
 Violência em programas de televisão X agressividade de crianças
 Quando pesquisamos a correlação entre programas de televisão 
violentos e os atos de agressão em crianças, estamos tentando 
determinar se intervir na redução do acesso das crianças à programas de 
televisão violentos reduzirá sua agressividade.
Os Efeitos das Intervenções
Padrão ouro
Experimento Controlado Randomizado
 Em um experimento controlado devidamente 
aleatorizado, todos os fatores que influenciam a 
variável resposta são estáticos ou variam ao acaso, 
exceto por uma, então qualquer alteração na 
variável resposta deve ser creditada a essa variável.
Os Efeitos das Intervenções
 Características de incêndios florestais X frequência de 
incêndios
 Não podemos controlar o tempo, portanto não podemos 
randomizar as variáveis que afetam os incêndios florestais.
 Fármaco contra o câncer X estado de saúde de um paciente
 Os ensaios clínicos aleatorizados de drogas podem ter problemas 
quando os participantes abandonam, não conseguem tomar a 
medicação ou notificam erroneamente seu uso.
 Violência em programas de televisão X agressividade de 
crianças
 Poderíamos alocar aleatoriamente os participantes em um estudo 
sobre violência na televisão, mas seria difícil controlar 
efetivamente a quantidade de televisão que cada criança assiste e 
quase impossível saber se os controlamos efetivamente ou não. 
Os Efeitos das Intervenções
 Alternativa...
 Estudos observacionais
 Os dados são apenas registrados, em vez de controlados.
 Problema
 É difícil separar o que é causal daquilo que é meramente uma 
correlação.
 Exemplos
 Hábito de tomar vinho X risco de ataque cardíaco
 Vacina contra gripe X risco de morte no ano seguinte
 Vitamina C X saúde geral
 Superficialidade X quantidade de troca de mensagens de texto
 ...
Diferença entre intervirem uma variável e 
condicionar nessa variável
 Quando intervimos em uma variável em modelo, nós 
corrigimos seu valor. 
 Quando condicionamos uma variável, não mudamos 
nada; simplesmente limitamos nosso foco ao 
subconjunto de casos em que a variável assume o 
valor que nos interessa.
Diferença entre intervir em uma variável e 
condicionar nessa variável
 Exemplo
Grafo representando a 
relação entre a temperatura 
(𝑍), as vendas de sorvete (𝑋)
e as taxas de criminalidade 
(𝑌)
Grafo representando uma 
intervenção no modelo na 
ao lado com a redução 
nas vendas de sorvete
Intervir em uma variável, resulta em um padrão de dependências totalmente 
diferente do que o condicionamento em uma variável.
Notação
 𝑃 𝑌 = 𝑦 𝑋 = 𝑥
 é a probabilidade de 𝑌 = 𝑦 condicional ao valor 𝑋 = 𝑥,
enquanto que
 𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥
 é a probabilidade de 𝑌 = 𝑦 quando intervimos para fazer 𝑋 =
𝑥.
 𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥 , 𝑍 = 𝑧
 denota a probabilidade condicional de 𝑌 = 𝑦, dado 𝑍 = 𝑧, na 
distribuição criada pela intervenção 𝑑𝑜 𝑋 = 𝑥 .
OBS.: 𝑃 𝑌 = 𝑦 𝑋 = 𝑥 reflete a distribuição populacional de 𝑌 entre 
indivíduos cujo valor 𝑋 é 𝑥. Por outro lado, 𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥
representa a distribuição populacional de 𝑌 se todos na população 
tiverem seu valor 𝑋 fixado em 𝑥.
A Fórmula de Ajuste
 Considere o seguinte exemplo onde
 𝑋 representa o uso de um fármaco, 
 𝑌 representa a recuperação, e 
 𝑍 significa sexo.
Exemplo: efeito de 
uma droga
 Para descobrir o quão eficaz é a droga na 
população, imaginamos uma intervenção 
hipotética através da qual administrarmos a 
droga uniformemente a toda a população e 
comparamos a taxa de recuperação com o 
que seria obtido sem a intervenção, onde 
evitamos que todos usem a droga.
 Considere
 𝑑𝑜 𝑋 = 1 = todos tomam a droga
 𝑑𝑜 𝑋 = 0 = ninguém toma a droga
 O objetivo é estimar
𝑃(𝑌 = 1|𝑑𝑜(𝑋 = 1)) − 𝑃(𝑌 = 1|𝑑𝑜(𝑋 = 0))
"Diferença de efeito causal" ou 
"efeito causal médio" (ACE).
Fórmula de ajuste
 Observações
 Se 𝑋 e 𝑌 podem assumir mais de um valor, gostaríamos 
de prever o efeito causal geral 𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥
 os efeitos causais não podem ser estimados a partir do 
próprio conjunto de dados sem uma história causal 
(paradoxo de Simpson)
 mas com a ajuda do grafo, podemos calcular a 
magnitude do efeito causal a partir dos dados.
Exemplo: efeito de 
uma droga com 
intervenção
𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥 = 𝑃𝑚 𝑌 = 𝑦 𝑋 = 𝑥
 𝑃𝑚, a probabilidade manipulada, 
compartilha duas propriedades 
essenciais com 𝑃
1. a probabilidade marginal 𝑃 𝑍 = 𝑧 é
invariante sob a intervenção, 
 o processo que determina 𝑍 não é 
afetado pela remoção da ligação de 𝑍
para 𝑋. (as proporções de homens e 
mulheres permanecem as mesmas antes 
e depois da intervenção)
2. a probabilidade condicional 
𝑃 𝑌 = 𝑦 𝑍 = 𝑧, 𝑋 = 𝑥 é invariante
 processo pelo qual 𝑌 responde a 𝑋 e 𝑍,
𝑌 = 𝑓 𝑥, 𝑧, 𝑢𝑌 permanece o mesmo, 
independentemente de 𝑋 mudar 
espontaneamente ou por manipulação 
deliberada.
Exemplo: efeito de uma droga com 
intervenção
 Equações de invariância
1. 𝑃𝑚 𝑍 = 𝑧 = 𝑃 𝑍 = 𝑧
e
2. 𝑃𝑚 𝑌 = 𝑦 𝑍 = 𝑧, 𝑋 = 𝑥 = 𝑃 𝑌 = 𝑦 𝑍 = 𝑧, 𝑋 = 𝑥
Exemplo: efeito de uma droga com 
intervenção
 Como 𝑍 e 𝑋 são d-separados (independentes) no 
modelo modificado, temos que Isso nos diz que 
𝑃𝑚 𝑍 = 𝑧 𝑋 = 𝑥 = 𝑃𝑚 𝑍 = 𝑧 = 𝑃 𝑍 = 𝑧
 Juntando essas considerações, temos
𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥 = 𝑃𝑚 𝑌 = 𝑦 𝑋 = 𝑥
(por definição)
= 
𝑧
𝑃𝑚 𝑌 = 𝑦 𝑋 = 𝑥, 𝑍 = 𝑧 𝑃𝑚 𝑍 = 𝑧 𝑋 = 𝑥
= 
𝑧
𝑃𝑚 𝑌 = 𝑦 𝑋 = 𝑥, 𝑍 = 𝑧 𝑃𝑚 𝑍 = 𝑧
Exemplo: efeito de uma droga com 
intervenção
 Usando as relações de invariância, obtemos uma 
fórmula para o efeito causal, em termos das 
probabilidades de pré-intervenção:
𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥
= 
𝑧
𝑃 𝑌 = 𝑦 𝑋 = 𝑥, 𝑍 = 𝑧 𝑃 𝑍 = 𝑧
Este procedimento é conhecido como "ajustar para Z" 
ou "controlar para Z."
Fórmula de ajuste: exemplo numérico
 Exemplo: efeito de uma droga com intervenção
 𝑋 = 1: o paciente que toma o medicamento, 
 𝑍 = 1: o paciente é homem e
 𝑌 = 1: paciente em recuperação.
Gênero​ Usaram a nova droga Não usaram a nova droga
Masculino​ 81 de 87 se recuperaram (93%)​ 234 de 270 se recuperaram (87%)​
Feminino​ 192 de 263 se recuperaram (73%)​ 55 de 80 se recuperaram (69%)​
Total​ 273 de 350se recuperaram (78%)​ 289 de 350 se recuperaram (83%)​
Tabela 1: Resultados de um estudo sobre uma nova droga, levando o gênero 
em consideração.​
Fórmula de ajuste: exemplo numérico
 Temos pela fórmula de ajuste que
𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1
= 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 1 𝑃 𝑍 = 1
+ 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 0 𝑃 𝑍 = 0
 Usando os dados da Tabela 1
𝑃 𝑍 = 1 =
87 + 270
700
= 0,51
𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 1 =
81
87
= 0,93103
𝑃 𝑍 = 0 =
263 + 80
700
= 0,49
𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 0 =
192
263
= 0,73004
Fórmula de ajuste: exemplo numérico
 Temos pela fórmula de ajuste que
𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1
= 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 1 𝑃 𝑍 = 1
+ 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 0 𝑃 𝑍 = 0
 Usando os dados da Tabela 1
𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1 = 0,93 × 0,51 + 0,73 × 0,49
= 0,832
Fórmula de ajuste: exemplo numérico
 Temos pela fórmula de ajuste que
𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 0
= 𝑃 𝑌 = 1 𝑋 = 0, 𝑍 = 1 𝑃 𝑍 = 1
+ 𝑃 𝑌 = 1 𝑋 = 0, 𝑍 = 0 𝑃 𝑍 = 0
 Usando os dados da Tabela 1
𝑃 𝑍 = 1 =
87 + 270
700
= 0,51
𝑃 𝑌 = 1 𝑋 = 0, 𝑍 = 1 =
234
270
= 0,86667
𝑃 𝑍 = 0 =
263 + 80
700
= 0,49
𝑃 𝑌 = 1 𝑋 = 0, 𝑍 = 0 =
55
80
= 0,6875
Fórmula de ajuste: exemplo numérico
 Temos pela fórmula de ajuste que
𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1
= 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 1 𝑃 𝑍 = 1
+ 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 0 𝑃 𝑍 = 0
 Usando os dados da Tabela 1
𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 0 = 0,87 × 0,51 + 0,69 × 0,49
= 0,7818
Fórmula de ajuste: exemplo numérico
 Comparando o efeito de tomar a droga (𝑋 = 1) com 
o efeito de não tomar (𝑋 = 0), obtemos 
𝐴𝐶𝐸 = 𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1 − 𝑃 𝑌 = 1 𝑋 = 0
= 0,832 − 0,7818 = 0,0502
ACE: a diferença na fração da população que se 
recuperaria se todos tomassem a droga em 
comparação com quando ninguém toma a droga.
Fórmula de ajuste: outro exemplo
 Exemplo de pressão sanguínea do paradoxo de 
Simpson
 Discutimos que o método mais sensível não seria 
condicionar a pressão arterial, mas examinar a 
tabela de população incondicional diretamente. 
Como a fórmula de ajuste poderia lidar com 
situações como essa?
 Pressão sanguínea
 RecuperaçãoUso do medicamento
Fórmula de ajuste: outro exemplo
 𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1 =?
 Pressão sanguínea
 RecuperaçãoUso do medicamento
Fórmula de ajuste: outro exemplo
 𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1 =?
 Primeiro, simulamos uma intervenção e examinamos a fórmula de 
ajuste resultante da intervenção simulada. 
 Como nenhuma ligação entra em 𝑋, já que 𝑋 não tem pais, não é
necessária nenhum “corte” no grafo. 
 As condições em que os dados foram obtidos foram tais que o 
tratamento foi atribuído "como se fosse randomizado". 
 Se houvesse um fator que fizesse com que os indivíduos preferissem ou 
rejeitassem o tratamento, esse fator deveria aparecer no modelo; a 
ausência de tal fator nos permite tratar 𝑋 como um tratamento 
aleatorizado.
 Sob tais condições, o grafo de intervenção é igual ao gráfico original 
e a fórmula de ajuste se reduz a
𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥 = 𝑃 𝑌 = 𝑦 𝑋 = 𝑥
 Se ajustássemos pela pressão arterial, obteríamos uma avaliação 
incorreta - correspondente a um modelo em que a pressão arterial fizesse 
com que as pessoas buscassem tratamento.Ajustar por... Ou não ajustar?
 Entender qual variável, ou conjunto de variáveis, 𝑍
pode ser legitimamente incluído na Fórmula de 
Ajuste.
 O procedimento de intervenção determina que 𝑍
deve coincidir com os pais de 𝑋, porque é a 
influência desses pais que neutralizamos quando 
corrigimos 𝑋 por manipulação externa.
 Seja 𝑃𝐴 𝑋 os pais de 𝑋.
Regra 1 (A Regra de Efeito Causal)
 Dado um grafo 𝐺 em que um conjunto de variáveis 
𝑃𝐴 são designadas como pais de 𝑋, o efeito causal 
de 𝑋 em 𝑌 é dado por
𝑃(𝑌 = 𝑦|𝑑𝑜 𝑋 = 𝑥 = 
𝑧
𝑃 𝑌 = 𝑦 𝑋 = 𝑥, 𝑃𝐴 = 𝑧 𝑃 𝑃𝐴 = 𝑧
onde 𝑧 varia em todas as combinações de valores que 
as variáveis na 𝑃𝐴 podem tomar.
Regra 1 (A Regra de Efeito Causal)
 Outra forma de expressa a Regra 1
𝑃(𝑌 = 𝑦|𝑑𝑜 𝑋 = 𝑥
= 
𝑧
𝑃 𝑌 = 𝑦 𝑋 = 𝑥, 𝑃𝐴 = 𝑧 𝑃 𝑃𝐴 = 𝑧 ∙
𝑃 𝑋 = 𝑥|𝑃𝐴 = 𝑧
𝑃 𝑋 = 𝑥|𝑃𝐴 = 𝑧
= 𝑃 𝑦 𝑑𝑜 𝑥 = 
𝑧
𝑃 𝑋 = 𝑥, 𝑌 = 𝑦, 𝑃𝐴 = 𝑧
𝑃 𝑋 = 𝑥|𝑃𝐴 = 𝑧
Escore de propensão
(Propensity score)
Observações
 Quais aspectos do grafo nos permitem prever os 
efeitos causais a partir de dados observacionais. 
Precisamos do grafo para determinar a identidade 
dos pais de 𝑋! 
 𝑋: o conjunto de fatores que, em condições não-
experimentais, seria suficiente para determinar o valor de 
𝑋, ou a probabilidade desse valor.
Observações
 Na maioria dos casos práticos, o conjunto de pais de 
𝑋 conterá variáveis não observadas que nos
impedirão de calcular as probabilidades condicionais
na Fórmula de Ajuste. 
 Como veremos nas seções seguintes, podemos 
ajustar para outras variáveis no modelo para 
substituir os elementos não medidos de 𝑃𝐴 𝑋 .
Intervenções múltiplas e a regra do produto 
truncado
 Ao derivar a Fórmula de Ajuste, assumimos uma 
intervenção em uma única variável, 𝑋, cujos pais 
foram “desconectados”, de modo a simular a 
ausência de sua influência após a intervenção.
 No entanto, em políticas sociais e médicas 
normalmente envolvem várias intervenções, ditando 
o valor de várias variáveis simultaneamente.
Intervenções múltiplas e a regra do produto 
truncado
 Regra da Decomposição do Produto
 A distribuição antes da intervenção para o modelo abaixo 
é dada pelo produto
𝑃 𝑥, 𝑦, 𝑧 = 𝑃 𝑧 𝑃 𝑥 𝑧 𝑃 𝑦 𝑥, 𝑧
Intervenções múltiplas e a regra do produto 
truncado
 Considerando a distribuição pós-intervenção, 
representada pela figura abaixo, é dada pelo 
produto
𝑃 𝑧, 𝑦 𝑑𝑜 𝑥 = 𝑃𝑚 𝑧 𝑃𝑚 𝑦 𝑥, 𝑧 = 𝑃 𝑧 𝑃 𝑦 𝑥, 𝑧
Intervenções múltiplas e a regra do produto 
truncado
𝑃 𝑧, 𝑦 𝑑𝑜 𝑥 = 𝑃𝑚 𝑧 𝑃𝑚 𝑦 𝑥, 𝑧 = 𝑃 𝑧 𝑃 𝑦 𝑥, 𝑧
 Isso coincide com a Fórmula de Ajuste, porque para 
avaliar 𝑃 𝑦 𝑑𝑜 𝑥 precisamos somar em 𝑧, o que dá
𝑃 𝑦 𝑑𝑜 𝑥 = 
𝑧
𝑃 𝑧 𝑃 𝑦 𝑥, 𝑧
Fórmula do produto truncado ou g-fórmula
 Generalizando a Fórmula de Ajuste para múltiplas 
intervenções, ou seja, intervenções que atribui 
valores constantes a um conjunto de variáveis 𝑋.
𝑃 𝑥1, 𝑥2, … , 𝑥𝑛 𝑑𝑜 𝑥 = 
𝑖
𝑃 𝑥𝑖 𝑝𝑎𝑖
para todo 𝑖 com 𝑋𝑖 não pertencente a 𝑋.
Exemplo
 suponha que uma interveção seja 
realizada no modelo da Figura 1 
fazendo 𝑋 = 𝑥 e 𝑍3 = 𝑧3. 
 A distribuição pós-intervenção 
(Figura 2) das outras variáveis no 
modelo será
𝑃 𝑧1, 𝑧2, 𝑤, 𝑦 𝑑𝑜 𝑋 = 𝑥, 𝑍3 = 𝑧3
= 𝑃 𝑧1 𝑃 𝑧2 𝑃 𝑤 𝑥 𝑃 𝑦 𝑤, 𝑧3, 𝑧2
 onde eliminamos os fatores 
𝑃 𝑥 𝑧1, 𝑧3 e 𝑃 𝑧3 𝑧1, 𝑧2 do 
produto.
Fig. 1: Modelo sem 
intervenção
Fig. 2: Modelo com 
intervenção
Exercício

Continue navegando