Modelos de Grafos e suas aplicações incompleto

•

UFJF

Isadora Lupchinski

06/12/2017

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 114 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 114 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 114 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Inferência Causal

8 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Inferência Causal
Segundo Semestre de 2017 / Professores:
Augusto C. Souza; Ângela M. Coelho; Marcel T. Vieira
Grafos de Probabilidade e Suas
Aplicações em Inferência Causal
Unidade 2
Grafos de probabilidade
 Revisão
http://dagitty.net/learn/graphs/
Grafos no R: Exercício 1.4.1
 Considere o grafo exibido na figura abaixo
 (A) Nomeie todos os pais de Z.
 (B) Nomeie todos os antepassados de Z.
 (C) Nomeie todos os filhos de W.
 (D) Nomeie todos os descendentes de W.
 (E) Desenhe todos os caminhos
(simples) entre X e T (ou seja, nenhum
nó deve aparecer mais de uma vez).
 (F) Desenhe todos os caminhos
orienados entre X e T.
Introdução
 Modelos causais representam o mecanismo pelo
qual os dados foram gerados.
 Dado um modelo causal verdadeiramente completo
para, digamos, os resultados dos exames de matemática
do ensino médio e dado uma lista completa de valores
para cada variável exógena desse modelo, podemos,
teoricamente, gerar um ponto de dados (ou seja, um
resultado de teste) para qualquer indivíduo.
Introdução
 Modelos causais representam o mecanismo pelo
qual os dados foram gerados.
 Poderíamos, em vez disso,
ter uma distribuição de probabilidade que
caracterizasse as variáveis exógenas,
nos permitiria gerar uma distribuição de pontuações
do teste
Introdução
 E se não tivermos nem um modelo causal probabilisticamente
especificado, mas apenas uma estrutura gráfica do modelo?
 Sabemos quais variáveis são causadas por outras variáveis, mas
não conhecemos a força ou a natureza dos relacionamentos.
 Mesmo com informações tão limitadas, podemos discernir
muito sobre o conjunto de dados gerado pelo modelo.
 A partir de um modelo causal gráfico não especificado
podemos aprender quais variáveis no conjunto de dados são
independentes entre si e quais são independentes uma da outra
condicionadas a outras variáveis.
Essas independências serão verdadeiras para cada conjunto
de dados gerado por um modelo causal com essa estrutura
gráfica, independentemente das funções específicas de um
SCM.
Modelo Estrutural
Causal (SCM)
Cenários
1.
 financiamento do ensino médio em dólares (𝑋)
 escore SAT médio (𝑌)
 taxa de aceitação da faculdade (𝑍) para um
determinado ano.
2.
 o estado de um interruptor de luz (𝑋),
 o estado de um circuito elétrico associado (𝑌)
 o estado de uma lâmpada (𝑍).
3.
1. horas que os participantes de uma corrida à pé
trabalham em seus empregos a cada semana
(𝑋),
2. horas que os participantes dedicam ao
treinamento a cada semana (𝑌)
3. tempo de conclusão, em minutos, que os
participantes conseguem na corrida (𝑍).
Modelo Estrutural
Causal (SCM)
 Variáveis exógenas – 𝑈𝑋, 𝑈𝑌, 𝑈𝑍
 são válidas para quaisquer efeitos
desconhecidos ou aleatórios que possam alterar
a relação entre as variáveis endógenas.
Modelo Estrutural
Causal (SCM)
1. Financiamento educacional
𝑉 = 𝑋, 𝑌, 𝑍
𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍
𝐹 = 𝑓𝑋, 𝐹𝑌, 𝐹𝑍
𝑓𝑋 ∶ 𝑋 = 𝑈𝑋
𝑓𝑌 ∶ 𝑌 =
𝑥
3
+ 𝑈𝑌
𝑓𝑍 ∶ 𝑍 =
𝑦
16
+ 𝑈𝑍
Modelo Estrutural
Causal (SCM)
1. Circuito Elétrico
𝑉 = 𝑋, 𝑌, 𝑍
𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍
𝐹 = 𝑓𝑋, 𝐹𝑌 , 𝐹𝑍
𝑓𝑋 ∶ 𝑋 = 𝑈𝑋
𝑓𝑌 ∶ 𝑌
=
𝐹𝑒𝑐ℎ𝑎𝑑𝑜 𝑆𝐸 𝑋 = 𝑜𝑛 𝐸 𝑈𝑌 = 0 𝑂𝑈 𝑋 = 𝑜𝑓𝑓 𝐸 𝑈𝑌 = 1
𝐴𝑏𝑒𝑟𝑡𝑜, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
𝑓𝑍 ∶ 𝑍
=
𝐹𝑒𝑐ℎ𝑎𝑑𝑜 𝑆𝐸 𝑋 = 𝑜𝑛 𝐸 𝑈𝑌 = 0 𝑂𝑈 𝑋 = 𝑜𝑓𝑓 𝐸 𝑈𝑌 = 1
𝐴𝑏𝑒𝑟𝑡𝑜, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
Modelo Estrutural
Causal (SCM)
1. Corrida
𝑉 = 𝑋, 𝑌, 𝑍
𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍
𝐹 = 𝑓𝑋, 𝐹𝑌, 𝐹𝑍
𝑓𝑋 ∶ 𝑋 = 𝑈𝑋
𝑓𝑌 ∶ 𝑌 = 84 − 𝑥 + 𝑈𝑌
𝑓𝑍 ∶ 𝑍 =
100
𝑦
+ 𝑈𝑍
Independência em SCM
 Nenhum dos SCM anteriores compartilha quaisquer
funções em comum.
 Mas porque eles compartilham uma estrutura gráfica
comum,
os conjuntos de dados gerados por todos os três
SCMs devem compartilhar certas independências.
Dependência e Independência em SCM
 As independências compartilhadas pelos conjuntos
de dados gerados por esses três SCMs e as
dependências provavelmente compartilhadas por
todos esses SCMs são:
1. 𝑍 e 𝑌 são dependentes
Para algum 𝑧, 𝑦, 𝑃 𝑍 = 𝑧|𝑌 = 𝑦 ≠ 𝑃 𝑍 = 𝑧
2. 𝑌 e 𝑋 são dependentes
Para algum 𝑦, 𝑥, 𝑃 𝑌 = 𝑦 𝑋 = 𝑥 ≠ 𝑃 𝑌 = 𝑦
3. 𝑍 e 𝑋 são provavelmente dependentes
Para algum 𝑧, 𝑥, 𝑃 𝑍 = 𝑧 𝑋 = 𝑥 ≠ 𝑃 𝑍 = 𝑧
4. 𝑍 e 𝑋 são independentes, condicionados em 𝑌
Para todo 𝑥, 𝑦, 𝑧,
𝑃 𝑍 = 𝑧 𝑋 = 𝑥, 𝑌 = 𝑦 = 𝑃 𝑍 = 𝑧 𝑌 = 𝑦
Dependência e
Independência em
SCM
 Observações
 Quaisquer duas variáveis, com uma
ligação entre elas, são dependentes.
 Em qualquer modelo causal,
independentemente das funções
específicas, duas variáveis conectadas por
uma ligação são dependentes.
 Se Z depende de 𝑌 e 𝑌 depende de
𝑋, então por quê 𝑍 é “provavelmente”
depende de 𝑋?
Dependência e Independência em SCM
 Casos patológicos: casos intransitivos
𝑉 = 𝑋, 𝑌, 𝑍
𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍
𝐹 = 𝑓𝑋, 𝐹𝑌, 𝐹𝑍
𝑓𝑋 ∶ 𝑋 = 𝑈𝑋
𝑓𝑌 ∶ 𝑌 =
𝑎
𝑏
𝑐
𝑠𝑒 𝑋 = 1 𝑒 𝑈𝑌 = 1
𝑠𝑒 𝑋 = 2 𝑒 𝑈𝑌 = 2
𝑠𝑒 𝑈𝑌 = 2
𝑓𝑍 ∶ 𝑍 =
𝑖
𝑗
𝑠𝑒 𝑌 = 𝑐 𝑜𝑢 𝑈𝑍 = 1
𝑠𝑒 𝑈𝑍 = 2
Dependência e
Independência em
SCM
 Observações
 Caso 4: 𝑍 e 𝑋 são independentes
condicionais em 𝑌.
 Considere que 𝑌 = 𝑎.
Queremos saber se, somente nesses
casos, o valor de 𝑍 é independente do
valor de 𝑋.
 Examinando apenas os casos em que
𝑌 = 𝑎,
 quando selecionamos casos com valores
diferentes de 𝑋, o valor de 𝑈𝑌 muda de
modo a manter 𝑌 em 𝑌 = 𝑎.
 mas como 𝑍 depende apenas de 𝑌 e 𝑈𝑍, e
não de 𝑈𝑌, o valor de 𝑍 permanece
inalterado.
 selecionar um valor diferente de 𝑋 não altera
o valor de 𝑍.
Então X é independente de Z,
condicional em Y.
Grafos em Cadeia
 Regra 1: Independência condicional em cadeias
Duas variáveis, 𝑋 e 𝑌, são
condicionalmente independentes, dado
𝑍, se houver apenas um caminho
unidirecional entre 𝑋 e 𝑌 e Z é qualquer
conjunto de variáveis que esteja nesse
caminho.
Grafos em Cadeia
 Regra 1: Observações
1. Dadas quaisquer duas variáveis 𝑋 e 𝑌, se o único
caminho entre 𝑋 e 𝑌 é composto inteiramente de
cadeias, então 𝑋 e 𝑌 são independentes condicionais
em qualquer variável intermediária nesse caminho.
2. Esta relação de independência se mantém
independentemente das funções que conectam as
variáveis.
3. A Regra 1 só vale quando assumimos que os
termos de erro 𝑼𝑿, 𝑼𝒀 e 𝑼𝒁 são independentes um
do outro.
SCM em forma de
Grafo
Cenários
1. Temperatura, vendas de sorvete e crime
 A temperatura do dia em uma cidade, em graus
Celsius (𝑋),
 O número de vendas em uma sorveteria local
nesse dia (𝑌) e
 O número de crimes violentos na cidade nesse dia
(Z).
𝑉 = 𝑋, 𝑌, 𝑍 𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍
𝐹 = 𝑓𝑋, 𝐹𝑌 , 𝐹𝑍
𝑓𝑋 ∶ 𝑋 = 𝑈𝑋
𝑓𝑌 ∶ 𝑌 = 4𝑥 + 𝑈𝑌
𝑓𝑍 ∶ 𝑍 =
𝑥
10
+ 𝑈𝑍
SCM em forma de
Grafo
Cenários
1. Interruptor e duas lâmpadas
 O estado (para cima ou para baixo) de um
interruptor (𝑋),
 o estado (ligada ou desligada) de uma lâmpada
(𝑌) e
 o estado (ligada ou desligada) de uma segunda
lâmpada (𝑍)
𝑉 = 𝑋, 𝑌, 𝑍 𝑈 = 𝑈𝑋, 𝑈𝑌, 𝑈𝑍
𝐹 = 𝑓𝑋, 𝐹𝑌, 𝐹𝑍
𝑓𝑋 ∶ 𝑋 = 𝑈𝑋
𝑓𝑌 ∶ 𝑌
=
𝐿𝑖𝑔𝑎𝑑𝑎 𝑆𝐸 𝑋 = 𝑐𝑖𝑚𝑎 𝐸 𝑈𝑌 = 0 𝑂𝑈 𝑋 = 𝑏𝑎𝑖𝑥𝑜 𝐸 𝑈𝑌 = 1
𝐷𝑒𝑠𝑙𝑖𝑔𝑎𝑑𝑎, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
𝑓𝑍 ∶ 𝑍
=
𝐿𝑖𝑔𝑎𝑑𝑎 𝑆𝐸 𝑋 = 𝑐𝑖𝑚𝑎 𝐸 𝑈𝑌 = 0 𝑂𝑈 𝑋 = 𝑏𝑎𝑖𝑥𝑜 𝐸 𝑈𝑌 = 1
𝐷𝑒𝑠𝑙𝑖𝑔𝑎𝑑𝑎, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜
Dependência e Independênciaem SCM em
formato de Garfo
 Se assumirmos que os termos de erro 𝑈𝑋, 𝑈𝑌 e 𝑈𝑍 são
independentes, então, examinando o modelo gráfico
podemos determinar que os SCMs acima compartilham
as seguintes dependências e independências:
1. 𝑋 e 𝑌 são dependentes
Para algum 𝑥, 𝑦, 𝑃 𝑍 = 𝑥|𝑌 = 𝑦 ≠ 𝑃 𝑋 = 𝑥
2. 𝑋 e 𝑍 são dependentes
Para algum 𝑥, 𝑧, 𝑃 𝑋 = 𝑥 𝑍 = 𝑧 ≠ 𝑃 𝑋 = 𝑥
3. 𝑍 e 𝑌 são provavelmente dependentes
Para algum 𝑧, 𝑦, 𝑃 𝑍 = 𝑧 𝑌 = 𝑦 ≠ 𝑃 𝑍 = 𝑧
4. 𝑌 e 𝑍 são independentes, condicionados em 𝑋
Para todo 𝑥, 𝑦, 𝑧,
𝑃 𝑌 = 𝑦 𝑍 = 𝑧, 𝑋 = 𝑥 = 𝑃 𝑌 = 𝑦 𝑋 = 𝑥
Dependência e
Independência em
SCM em formato
de Garfo
 Observações
 Os pontos 1 e 2 seguem, mais uma
vez, o fato de que 𝑌 e 𝑍 estão
diretamente conectados a 𝑋 por uma
seta.
 Se 𝑌 muda quando 𝑋 muda e 𝑍
também muda quando 𝑋 muda, então
é provável (embora não seja certo)
que 𝑌 muda junto com 𝑍 e vice-versa.
Assim sendo,
 Uma vez que uma alteração no valor
de 𝑌 nos dá informações sobre uma
alteração associada no valor de 𝑍, 𝑌 e
𝑍 são provavelmente variáveis
dependentes.
Dependência e
Independência em
SCM em formato
de Garfo
 Observações
 Como o 𝑋 não muda, os valores de 𝑌
e 𝑍 não mudam de acordo com 𝑋 –
eles mudam apenas em resposta a 𝑈𝑌
e 𝑈𝑍, que assumimos ser
independentes.
 Portanto, quaisquer alterações
adicionais nos valores de 𝑌 e 𝑍
devem ser independentes uma da
outra.
Grafos em Garfo
 Se duas variáveis compartilham uma causa comum, e se
essa causa comum faz parte do único caminho entre
elas, então o raciocínio análogo ao acima nos diz que
essas dependências e independências condicionais são
verdadeiras para essas variáveis.
 Regra 2 (Independência condicional em Garfos)
Se uma variável 𝑋 é uma causa comum
das variáveis 𝑌 e 𝑍 e existe apenas um
caminho entre 𝑌 e 𝑍, então 𝑌 e 𝑍 são
independentes condicionais em 𝑋.
Colisão (colliders)
 A versão mais simples de um grafo de colisão ocorre
quando um vértice recebe setas de outros dois
vértices.
Grafo de
Colisão
 Relações de dependência e
independência
1. 𝑋 e 𝑍 são dependentes.
Para alguns 𝑥, 𝑧,
𝑃 𝑋 = 𝑥 𝑍 = 𝑧 ≠ 𝑃 𝑋 = 𝑥
2. 𝑌 e 𝑍 são dependentes.
Para alguns 𝑦, 𝑧,
𝑃 𝑌 = 𝑦 𝑍 = 𝑧 ≠ 𝑃 𝑌 = 𝑦
3. 𝑋 e 𝑌 são independentes.
Para todo 𝑥, 𝑦,
𝑃 𝑋 = 𝑥 𝑌 = 𝑦 = 𝑃 𝑋 = 𝑥
4. 𝑋 e 𝑌 são dependentes condicionais
em 𝑍.
Para alguns 𝑥, 𝑦, 𝑧,
𝑃(𝑋 = 𝑥|𝑌 = 𝑦, 𝑍 = 𝑧) ≠ 𝑃 (𝑋 = 𝑥|𝑍 = 𝑧)
Grafo de
Colisão
 Relações de dependência e
independência
1. 𝑋 e 𝑍 são dependentes.
Para alguns 𝑥, 𝑧,
𝑃 𝑋 = 𝑥 𝑍 = 𝑧 ≠ 𝑃 𝑋 = 𝑥
2. 𝑌 e 𝑍 são dependentes.
Para alguns 𝑦, 𝑧,
𝑃 𝑌 = 𝑦 𝑍 = 𝑧 ≠ 𝑃 𝑌 = 𝑦
A veracidade dos dois primeiros
pontos foi estabelecida anteriormente
Grafo de
Colisão
 Relações de dependência e
independência
3. 𝑋 e 𝑌 são independentes.
Para todo 𝑥, 𝑦,
𝑃 𝑋 = 𝑥 𝑌 = 𝑦 = 𝑃 𝑋 = 𝑥
 Nem 𝑋 nem 𝑌 são descendentes
ou antepassados um do outro, nem
dependem da mesma variável.
 Eles respondem apenas a 𝑈𝑋 e 𝑈𝑌,
que são considerados independentes,
portanto,
não há mecanismo causal pelo qual
as variações no valor de 𝑋 devem
estar associadas a variações no
valor de 𝑌.
Grafo de
Colisão
 Relações de dependência e
independência
4. 𝑋 e 𝑌 são dependentes condicionais
em 𝑍.
Para alguns 𝑥, 𝑦, 𝑧,
𝑃(𝑋 = 𝑥|𝑌 = 𝑦, 𝑍 = 𝑧) ≠ 𝑃 (𝑋 = 𝑥|𝑍 = 𝑧)
Por que duas variáveis
independentes de repente se
tornariam dependentes quando
condicionamos ao efeito de cada
uma, que é comum?
Grafo de
Colisão
 Relações de dependência e
independência
4. 𝑋 e 𝑌 são dependentes condicionais
em 𝑍.
Para alguns 𝑥, 𝑦, 𝑧,
𝑃(𝑋 = 𝑥|𝑌 = 𝑦, 𝑍 = 𝑧) ≠ 𝑃 (𝑋 = 𝑥|𝑍 = 𝑧)
Como 𝑍 depende, para o seu valor,
de 𝑋 e 𝑌, ao comparar casos em que
Z assume, por exemplo, o valor 𝑎,
qualquer alteração no valor de 𝑋
deve ser compensada por uma
alteração no valor de 𝑌 – caso
contrário, o valor de 𝑍 também
mudaria.
Grafo de
Colisão
 Relações de dependência e
independência
4. 𝑋 e 𝑌 são dependentes condicionais
em 𝑍.
Para alguns 𝑥, 𝑦, 𝑧,
𝑃(𝑋 = 𝑥|𝑌 = 𝑦, 𝑍 = 𝑧) ≠ 𝑃 (𝑋 = 𝑥|𝑍 = 𝑧)
De um modo geral,
O condicionamento em um vértice de
colisão produz uma dependência
entre os pais do vértice
Exemplo 1
 Suponha que uma certa faculdade dê bolsas de
estudo a dois tipos de alunos:
 aqueles com talentos musicais extraordinários e
 aqueles com notas médias extraordinárias.
 Estes dois traços são independentes?
 Se você encontrar alguém que tenha recebido uma
bolsa nesta faculdade muda alguma coisa?
 Nesta situação, saber que o bolsista não possui nenhum
talento musical, nos informa o que...
Exemplo 2
 Considere o lançamento simultâneo (independente)
de duas moedas honestas e um sino que toca
sempre que pelo menos uma das moedas caia com
a face “cara” voltada para cima
 Sejam os resultados das duas moedas denotados
por 𝑋 e 𝑌, respectivamente, e seja 𝑍 o estado do
sino, com 𝑍 = 1 representando “o sino toca” e 𝑍 = 0
representando o silêncio.
Exemplo 2
 Se assumirmos que ouvimos o toque da sino, a
probabilidade de que a moeda 1 dê cara muda se
descobrimos que a moeda 2 também deu cara?
Exemplo 2
 Se assumirmos que ouvimos o toque da sino, a
probabilidade de que a moeda 1 dê cara muda se
descobrimos que a moeda 2 também deu cara?
 Considere as seguintes probabilidades iniciais:
𝑿 𝒀 𝒁 𝑷 𝑿, 𝒀, 𝒁
Cara Cara 1 0,25
Cara Coroa 1 0,25
Coroa Cara 1 0,25
Coroa Coroa 0 0,25
Exemplo 2
 𝑋 e 𝑌 são independents
𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑌 = “𝐶𝑎𝑟𝑎” =
𝑃 𝑋 = “𝐶𝑜𝑟𝑜𝑎” 𝑌 = “𝐶𝑜𝑟𝑜𝑎” =
1
2
 Agora, vamos condicionar em 𝑍 = 1 e 𝑍 = 0
Exemplo 2
 Condicionado em 𝑍 = 1 e 𝑍 = 0
𝑿 𝒀 𝑷 𝑿, 𝒀 𝒁 = 𝟏
Cara Cara 0,333
Cara Coroa 0,333
Coroa Cara 0,333
Coroa Coroa 0
𝑿 𝒀 𝑷 𝑿, 𝒀 𝒁 = 𝟎
Cara Cara 0
Cara Coroa 0
Coroa Cara 0
Coroa Coroa 1
Exemplo 2
 Se assumirmos que ouvimos o toque da sino, a
probabilidade de que a moeda 1 dê cara muda se
descobrimos que a moeda 2 também deu cara?
𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑍 = 1 =
1
3
+
1
3
=
2
3
𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑌 = “𝐶𝑎𝑟𝑎”, 𝑍 = 1 =
1
2
Grafo de colisão com descendentes
 Assim como condicionar em um vértice de colisão
torna as variáveis anteriormente independentes em
dependentes, o condicionamento em qualquer
descendente de um vértice de colisão também os
torna dependentes.
Grafo de colisão
com descendentes
 Retornemos ao exemplo das
moedas e do sino:
 Suponhamos que não ouvimos
diretamente o sino, mas contamos
com o relato de uma testemunha que
é pouco confiável;
 sempre que a campainha não toca, há
50% de chance de que nossa
testemunha fale falsamente que a
campainha tocou.
 Seja 𝑊 o relato da testemunha.
Grafo de colisão
com descendentes
 Probabilidades para todas as
combinações de 𝑋, 𝑌 e 𝑊
𝑿 𝒀 𝑾 𝑷 𝑿, 𝒀,𝑾
Cara Cara 1 0,25
Cara Coroa 1 0,25
Coroa Cara 1 0,25
Coroa Coroa 1 0,125
Coroa Coroa 0 0,125
Grafo de colisão
com descendentes
 Podemos verificar que
𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑌 = “𝐶𝑎𝑟𝑎” = 𝑃 𝑋 = “𝐶𝑎𝑟𝑎”
= 1/2
e
𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑊 = 1
=
0,25 + 0,25
0,25 + 0,25 + 0,25 + 0,125
=
0,5
0,85
e
𝑃 𝑋 = “𝐶𝑎𝑟𝑎” 𝑌 = "𝐶𝑎𝑟𝑎",𝑊 = 1
=
0,25
0,25 + 0,25
= 0,5 <
0,5
0,85
Grafos de Colisão
 Regra 3 (Dependência condicional em colisões)
Se uma variável 𝑍 é um vértice de colisão
entreduas variáveis 𝑋 e 𝑌, e existe apenas
um caminho entre 𝑋 e 𝑌, então 𝑋 e 𝑌 são
incondicionalmente independentes, mas
dependentes condicionais em 𝑍 e em
qualquer descendente de 𝑍.
Grafos de Colisão
 Observações
 A regra 3 é extremamente importante para o estudo da
causalidade.
 Veremos que esta regra nos permite testar se um modelo
causal poderia ter gerado um conjunto de dados,
 Descobrir modelos a partir de dados e
 resolver totalmente o Paradox de Simpson, determinando quais
variáveis a serem medidas e como estimar os efeitos causais
sob variáveis de confusão.
Exercício - Solução
Regras básicas
 Regra 1: Independência condicional em cadeias
 Duas variáveis, 𝑋 e 𝑌, são condicionalmente independentes, dado
𝑍, se houver apenas um caminho unidirecional entre 𝑋 e 𝑌 e Z é
qualquer conjunto de variáveis que esteja nesse caminho.
 Regra 2 (Independência condicional em Garfos)
 Se uma variável 𝑋 é uma causa comum das variáveis 𝑌 e 𝑍 e
existe apenas um caminho entre 𝑌 e 𝑍, então 𝑌 e 𝑍 são
independentes condicionais em 𝑋.
 Regra 3 (Dependência condicional em colisões)
 Se uma variável 𝑍 é um vértice de colisão entre duas
variáveis 𝑋 e 𝑌, e existe apenas um caminho entre 𝑋 e 𝑌,
então 𝑋 e 𝑌 são incondicionalmente independentes, mas
dependentes condicionais em 𝑍 e em qualquer descendente
de 𝑍.
d-separação (d-separation)
 Na maioria dos modelos gráficos, os pares de
variáveis serão conectados por vários caminhos
possíveis e cada um desses caminhos irá passar
por uma variedade de cadeias, garfos e colisões.
Existe um critério ou processo que pode ser aplicado
a um modelo causal gráfico de qualquer complexidade
para prever dependências compartilhadas por todos
os conjuntos de dados gerados por esse gráfico?
d-separação (d-separation)
 É construída de acordo com as regras estabelecidas
anteriormente.
 d-separação (o d significa “directional”)
 nos permite determinar, para qualquer par de
vértices, se os vértices são
 d-conectados, o que significa que existe um caminho de
conexão entre eles, ou
 Os vértices são, provavelmente, dependentes. (casos
intrasitivos)
 d-separados, o que significa que não existe esse
caminho.
 as variáveis que os vértices representam são definitivamente
independentes
d-separação (d-separation)
 Observações
 Dois vértices 𝑋 e 𝑌 são d-separados se todos os
caminhos entre eles (se existir algum) estiverem
bloqueados.
 Se mesmo apenas um caminho entre 𝑋 e 𝑌 for desbloqueado,
𝑋 e 𝑌 são d-conectados.
 Existem certos tipos de vértices que podem bloquear um
caminho, dependendo se estamos executando uma d-
separação incondicional ou condicional.
 Se não estamos condicionando em qualquer variável, então
apenas as colisões podem bloquear um caminho.
Então, se cada caminho entre dois vértices 𝑋 e 𝑌 tiver uma
colisão, 𝑋 e 𝑌 não podem ser incondicionalmente dependentes;
eles devem ser marginalmente independentes.
d-separação (d-separation)
 Observações
 Se, no entanto, estamos condicionando em um conjunto
de vértices 𝑍, então os seguintes tipos de vértices podem
bloquear um caminho:
 Uma colisão que não está condicionada (isto é, não
está em 𝑍), e que não possui descendentes em 𝑍.
 Uma cadeia ou garfo cujo vértice central está em 𝑍.
Justificativas
 Se um vértice de colisão não está no conjunto de
condicionamento 𝑍,
 então a dependência é bloqueada; (independência)
 mas, se vértice de colisão, ou seus descendentes, está
no conjunto de condicionamento,
 então, a dependência está presente.
 Por outro lado, a dependência pode passar através de
cadeias e garfos - mas as Regras 1 e 2 nos dizem que
 quando cadeias e garfos são condicionados, as variáveis em
cada extremidade desses caminhos tornam-se independentes
(quando consideramos um caminho por vez).
 Portanto, qualquer vértice de não-colisão no conjunto de
condicionamento bloquearia a dependência, enquanto
que um que não está no conjunto de condicionamento
permitiria a dependência.
Definição geral da d-separação
Um caminho 𝒑 é bloqueado por um conjunto de vértices 𝒁
se, e somente se, 1:
1. 𝑝 contém uma cadeia de vértices A → B → C ou um garfo A
← B → C tal que o vértice do meio, B, está em 𝑍 (ou seja, 𝑝
está condicionado em 𝐵), ou
2. 𝑝 contém uma colisão A → B ← C tal que o vértice de
colisão B não está em 𝑍, e nenhum descendente de B está
em 𝑍.
Se 𝑍 bloquear todos os caminhos entre dois nós 𝑋 e 𝑌, então 𝑋
e 𝑌 são d-separados, condicionais em 𝑍 e, portanto, são
independentes em 𝑍.
 caminho bloqueado = variáveis independentes
Exemplo 1
 Observações
 Este grafo pode estar associado a
qualquer modelo causal.
 As variáveis podem ser discretas,
contínuas ou uma mistura das duas.
 As relações entre eles podem ser
lineares, exponenciais ou qualquer
outra relação.
 Independentemente do modelo, no
entanto,
a d-separação sempre proporcionará
o mesmo conjunto de
independências nos dados que o
modelo gera.
Exemplo 1
 Considere a relação entre 𝑍 e 𝑌.
 Usando um conjunto de
condicionamento vazio, 𝑍 = ,
eles são d-separados, o que nos
diz que 𝑍 e 𝑌 são
incondicionalmente independentes.
 Por quê?
Exemplo 1
 Considere a relação entre 𝑍 e 𝑌.
 Usando um conjunto de
condicionamento vazio, 𝑍 = ,
eles são d-separados, o que nos
diz que 𝑍 e 𝑌 são
incondicionalmente
independentes.
 Por quê?
 Existe apenas um caminho entre 𝑍 e
𝑌 e esse caminho é bloqueado por
uma colisão (Z → W ← X).
Exemplo 1
 Considere a relação entre 𝑍 e 𝑌.
 Suponha, agora, que condicionamos
o caminho em 𝑊.
 As regras da d-separação nos diz
que 𝑍 e Y são d-conectados,
condicionado em 𝑊.
 Por quê?
Exemplo 1
 Considere a relação entre 𝑍 e 𝑌.
 Suponha, agora, que condicionamos o
caminho em 𝑊.
 As regras da d-separação nos diz que
𝑍 e Y são d-conectados
(dependentes), condicionado em 𝑊.
 Por quê?
 Neste caso em que o conjunto de
condicionamento é 𝑊 e tem um único
caminho entre 𝑍 e 𝑌que contém um garfo
(𝑋) que não está no conjunto 𝑊 , e o
único vértice de colisão (𝑊) no caminho
está nesse conjunto, esse caminho não
está bloqueado.
 O mesmo é verdade se condicionarmos em
𝑈, porque 𝑈 é um descendente de uma
colisão ao longo do caminho entre 𝑍 e 𝑌.
Exemplo 1
 Considere a relação entre 𝑍 e 𝑌.
 Considere, agora, que condicionamos
o caminho ao conjunto 𝑊,𝑋 ,
 𝑍 e 𝑌 continuam dependentes?
Exemplo 1
 Considere a relação entre 𝑍 e 𝑌.
 Considere, agora, que condicionamos o
caminho ao conjunto 𝑊,𝑋 ,
 𝑍 e 𝑌 continuam dependentes?
 Existe agora no caminho em ter 𝑍 e 𝑌 um
vértice não-colisor (𝑋) que está no
conjunto de condicionamento.
 Embora 𝑊 tenha sido desbloqueado por
condicionamento, um vértice bloqueado
é suficiente para bloquear todo o
caminho.
Uma vez que o único caminho entre 𝑍 e
𝑌 está bloqueado por este conjunto de
condicionamento, 𝑍 e 𝑌 são 𝑑-
separados condicionados em {𝑊, 𝑋}.
Exemplo 2
 Agora 𝑍 e 𝑌 agora são
incondicionalmente
dependentes.
 Por quê?
Exemplo 2
 Agora 𝑍 e 𝑌 agora são
incondicionalmente
dependentes.
 Por quê?
Porque há um caminho entre eles
(Z ← T → Y) que não contém
colisões.
Exemplo 2
 Condicionando o caminho em 𝑇
 O que acontece?
Exemplo 2
 Condicionando o caminho em 𝑇
 O que acontece?
Esse caminho fica bloqueado e 𝑍 e 𝑌
tornam-se independentes
novamente
Exemplo 2
 Condicionando o caminho em 𝑇
 O que acontece?
Esse caminho fica bloqueadoe 𝑍 e 𝑌
tornam-se independentes
novamente
 Condicionando o caminho em
𝑇,𝑊
Exemplo 2
 Condicionando o caminho em 𝑇
 O que acontece?
Esse caminho fica bloqueado e 𝑍 e 𝑌
tornam-se independentes
novamente
 Condicionando o caminho em
𝑇,𝑊
Torna-os conectados novamente
(dependentes).
O condicionamento em 𝑇 bloqueia o caminho Z
← T → Y, mas o condicionamento em 𝑊
desbloqueia o caminho Z → W ← X → Y.
Exemplo 2
 Condicionando o caminho em
𝑇,𝑊, 𝑋
 O que acontece?
Exemplo 2
 Condicionando o caminho em
𝑇,𝑊, 𝑋
 O que acontece?
𝑍 e 𝑌 tornam-se independentes
novamente!
 Por quê?
Exemplo 2
 Resumo
𝑍 e 𝑌 são d-conectados (e, portanto,
provavelmente dependentes)
condicionais em
𝑊, U, 𝑊,𝑈 , 𝑊,𝑇 , 𝑈, 𝑇 , 𝑊,𝑈, 𝑇 ,
𝑊,𝑋 , 𝑈, 𝑋 e {𝑊,𝑈, 𝑋}.
Eles são 𝑑-separados (e, portanto,
independentes) em
𝑇, 𝑋, 𝑇 , 𝑊,𝑋, 𝑇 , 𝑈, 𝑋, 𝑇 e
𝑊,𝑈, 𝑋, 𝑇 .
Exemplo 2
 Observação
Eles são 𝑑-separados (e, portanto,
independentes) em
𝑇, 𝑋, 𝑇 , 𝑊,𝑋, 𝑇 , 𝑈, 𝑋, 𝑇 e 𝑊,𝑈, 𝑋, 𝑇 .
Observe que 𝑇 está em cada conjunto
de condicionamento que d-separa 𝑍 e 𝑌;
Isso é porque 𝑇 é o único vértice em um
caminho que incondicionalmente 𝑑-
conecta 𝑍 e 𝑌, então, a menos que o
caminho esteja condicionado, 𝑍 e 𝑌
sempre serão 𝑑-conectados.
Exercício
Teste de modelo e pesquisa causal
 Vimos que modelos causais têm implicações testáveis
nos conjuntos de dados que geram.
 se tivermos um grafo 𝐺 que acreditamos que poderia ter
gerado um conjunto de dados 𝑆, a 𝑑-separação nos indicará
quais variáveis em 𝐺 devem ser condicionalmente
independentes sobre quais outras variáveis.
 Como isso funciona?
 Suponhamos que listamos as condições de d-separação em 𝐺 e
notamos que as variáveis 𝐴 e 𝐵 devem ser independentes
condicionais em 𝐶.
 Suponha, agora, que estimemos as probabilidades com base em 𝑆
e descobrimos que os dados sugerem que 𝐴 e 𝐵 não são
independentes condicionais em 𝐶.
Podemos então rejeitar 𝐺 como um possível
modelo causal para 𝑆.
Exemplo
 Considerando que 𝑊 e 𝑍1 são
independentes, dado 𝑋.
 Suponha que regredimos 𝑊 em 𝑋
e 𝑍1.
𝑤 = 𝑎𝑥 + 𝑏𝑧1
 Se, ao avaliarmos o modelo,
verificar-mos que 𝑏 não é igual a
zero,
sabemos que 𝑊 depende de 𝑍1 dado
𝑋 e, conseqüentemente, que o
modelo está errado.
Exemplo
 Observações
 Neste caso, sabemos também onde
está errado;
o modelo (grafo) causal verdadeiro deve
ter um caminho entre 𝑊 e 𝑍1 que não
seja d-separado por 𝑋.
 Este é um resultado teórico que é
válido para todos os modelos
acíclicos com erros independentes
 Cada condição de separação do
modelo corresponde a uma
independência condicional nos dados,
nenhum outro teste pode refutar o
modelo.
Método tradicional de teste de ajuste de um
modelo
 Teste de hipóteses estatísticas de todo o modelo
 avaliamos o quão provável é que a amostra observada
tenham sido gerada pelo modelo proposto na hipótese,
ao contrário de ter ocorrido por pura chance.
 Isso pode ser feito (aproximadamente) assumindo
 um modelo linear e gaussiano,
 Como,
 sob tais pressupostos, a distribuição da conjunta pode ser
expressa sucintamente em termos dos parâmetros do modelo,
e podemos então avaliar a probabilidade de que as amostras
observadas tenham sido geradas pelo modelo totalmente
parametrizado.
Método tradicional de teste de ajuste de um
modelo
 Questões importantes
1. Se algum parâmetro não puder ser estimado, a
distribuição conjunta não pode ser estimada e o modelo
não pode ser testado.
 Os termos de erro estão correlacionados ou algumas das
variáveis não são observadas.
2. Modelo testado globalmente.
 Dificuldade de identificar o motivo da falta de ajuste.
3. Quando testamos um modelo de forma global, o número
de variáveis envolvidas pode ser grande e, se houver
erro de mensuração / ou uma variação amostral
associada a cada variável, o teste não será confiável.
Vantagens da d-separação
1. É não-paramétrico
 não depende das funções específicas que conectam
variáveis.
2. Testa modelos localmente, em vez de globalmente.
 permite identificar pontos específicos onde nosso modelo
apresenta problemas e repará-los.
Classes de equivalência de DAG
 classe de equivalência: conjunto de grafos com
implicações indistinguíveis.
 Dois grafos 𝐺1 e 𝐺2 estão na mesma classe de
equivalência se
 compartilham as mesmas ligações, independentemente da
direção e se
 compartilham vértices de colisão cujos pais não são adjacente
(v-estrutura).
Quaisquer dois grafos que satisfaçam este critério têm
conjuntos idênticos de condições de d-separação e,
portanto, conjuntos idênticos de implicações testáveis.
Classes de equivalência de DAG
 A importância desse resultado é que nos permite
pesquisar um conjunto de dados para os modelos
causais que poderiam tê-lo gerado.
 Assim, não só podemos começar com um modelo
causal e gerar um conjunto de dados, mas também
podemos começar com um conjunto de dados e
buscar a um modelo causal que o explique.
Os Efeitos das Intervenções
O objetivo final de muitos estudos estatísticos é prever os efeitos das
intervenções.
 Características de incêndios florestais X frequência de incêndios
 Quando coletamos dados sobre fatores associados a incêndios florestais,
estamos realmente procurando por algo que possamos intervir para
diminuir a frequência do incêndio.
 Fármaco contra o câncer X estado de saúde de um paciente
 Quando realizamos um estudo sobre um novo fármaco contra o câncer,
estamos tentando identificar como a doença de um paciente responde
quando intervimos medicando o paciente.
 Violência em programas de televisão X agressividade de crianças
 Quando pesquisamos a correlação entre programas de televisão
violentos e os atos de agressão em crianças, estamos tentando
determinar se intervir na redução do acesso das crianças à programas de
televisão violentos reduzirá sua agressividade.
Os Efeitos das Intervenções
Padrão ouro
Experimento Controlado Randomizado
 Em um experimento controlado devidamente
aleatorizado, todos os fatores que influenciam a
variável resposta são estáticos ou variam ao acaso,
exceto por uma, então qualquer alteração na
variável resposta deve ser creditada a essa variável.
Os Efeitos das Intervenções
 Características de incêndios florestais X frequência de
incêndios
 Não podemos controlar o tempo, portanto não podemos
randomizar as variáveis que afetam os incêndios florestais.
 Fármaco contra o câncer X estado de saúde de um paciente
 Os ensaios clínicos aleatorizados de drogas podem ter problemas
quando os participantes abandonam, não conseguem tomar a
medicação ou notificam erroneamente seu uso.
 Violência em programas de televisão X agressividade de
crianças
 Poderíamos alocar aleatoriamente os participantes em um estudo
sobre violência na televisão, mas seria difícil controlar
efetivamente a quantidade de televisão que cada criança assiste e
quase impossível saber se os controlamos efetivamente ou não.
Os Efeitos das Intervenções
 Alternativa...
 Estudos observacionais
 Os dados são apenas registrados, em vez de controlados.
 Problema
 É difícil separar o que é causal daquilo que é meramente uma
correlação.
 Exemplos
 Hábito de tomar vinho X risco de ataque cardíaco
 Vacina contra gripe X risco de morte no ano seguinte
 Vitamina C X saúde geral
 Superficialidade X quantidade de troca de mensagens de texto
 ...
Diferença entre intervirem uma variável e
condicionar nessa variável
 Quando intervimos em uma variável em modelo, nós
corrigimos seu valor.
 Quando condicionamos uma variável, não mudamos
nada; simplesmente limitamos nosso foco ao
subconjunto de casos em que a variável assume o
valor que nos interessa.
Diferença entre intervir em uma variável e
condicionar nessa variável
 Exemplo
Grafo representando a
relação entre a temperatura
(𝑍), as vendas de sorvete (𝑋)
e as taxas de criminalidade
(𝑌)
Grafo representando uma
intervenção no modelo na
ao lado com a redução
nas vendas de sorvete
Intervir em uma variável, resulta em um padrão de dependências totalmente
diferente do que o condicionamento em uma variável.
Notação
 𝑃 𝑌 = 𝑦 𝑋 = 𝑥
 é a probabilidade de 𝑌 = 𝑦 condicional ao valor 𝑋 = 𝑥,
enquanto que
 𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥
 é a probabilidade de 𝑌 = 𝑦 quando intervimos para fazer 𝑋 =
𝑥.
 𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥 , 𝑍 = 𝑧
 denota a probabilidade condicional de 𝑌 = 𝑦, dado 𝑍 = 𝑧, na
distribuição criada pela intervenção 𝑑𝑜 𝑋 = 𝑥 .
OBS.: 𝑃 𝑌 = 𝑦 𝑋 = 𝑥 reflete a distribuição populacional de 𝑌 entre
indivíduos cujo valor 𝑋 é 𝑥. Por outro lado, 𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥
representa a distribuição populacional de 𝑌 se todos na população
tiverem seu valor 𝑋 fixado em 𝑥.
A Fórmula de Ajuste
 Considere o seguinte exemplo onde
 𝑋 representa o uso de um fármaco,
 𝑌 representa a recuperação, e
 𝑍 significa sexo.
Exemplo: efeito de
uma droga
 Para descobrir o quão eficaz é a droga na
população, imaginamos uma intervenção
hipotética através da qual administrarmos a
droga uniformemente a toda a população e
comparamos a taxa de recuperação com o
que seria obtido sem a intervenção, onde
evitamos que todos usem a droga.
 Considere
 𝑑𝑜 𝑋 = 1 = todos tomam a droga
 𝑑𝑜 𝑋 = 0 = ninguém toma a droga
 O objetivo é estimar
𝑃(𝑌 = 1|𝑑𝑜(𝑋 = 1)) − 𝑃(𝑌 = 1|𝑑𝑜(𝑋 = 0))
"Diferença de efeito causal" ou
"efeito causal médio" (ACE).
Fórmula de ajuste
 Observações
 Se 𝑋 e 𝑌 podem assumir mais de um valor, gostaríamos
de prever o efeito causal geral 𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥
 os efeitos causais não podem ser estimados a partir do
próprio conjunto de dados sem uma história causal
(paradoxo de Simpson)
 mas com a ajuda do grafo, podemos calcular a
magnitude do efeito causal a partir dos dados.
Exemplo: efeito de
uma droga com
intervenção
𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥 = 𝑃𝑚 𝑌 = 𝑦 𝑋 = 𝑥
 𝑃𝑚, a probabilidade manipulada,
compartilha duas propriedades
essenciais com 𝑃
1. a probabilidade marginal 𝑃 𝑍 = 𝑧 é
invariante sob a intervenção,
 o processo que determina 𝑍 não é
afetado pela remoção da ligação de 𝑍
para 𝑋. (as proporções de homens e
mulheres permanecem as mesmas antes
e depois da intervenção)
2. a probabilidade condicional
𝑃 𝑌 = 𝑦 𝑍 = 𝑧, 𝑋 = 𝑥 é invariante
 processo pelo qual 𝑌 responde a 𝑋 e 𝑍,
𝑌 = 𝑓 𝑥, 𝑧, 𝑢𝑌 permanece o mesmo,
independentemente de 𝑋 mudar
espontaneamente ou por manipulação
deliberada.
Exemplo: efeito de uma droga com
intervenção
 Equações de invariância
1. 𝑃𝑚 𝑍 = 𝑧 = 𝑃 𝑍 = 𝑧
e
2. 𝑃𝑚 𝑌 = 𝑦 𝑍 = 𝑧, 𝑋 = 𝑥 = 𝑃 𝑌 = 𝑦 𝑍 = 𝑧, 𝑋 = 𝑥
Exemplo: efeito de uma droga com
intervenção
 Como 𝑍 e 𝑋 são d-separados (independentes) no
modelo modificado, temos que Isso nos diz que
𝑃𝑚 𝑍 = 𝑧 𝑋 = 𝑥 = 𝑃𝑚 𝑍 = 𝑧 = 𝑃 𝑍 = 𝑧
 Juntando essas considerações, temos
𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥 = 𝑃𝑚 𝑌 = 𝑦 𝑋 = 𝑥
(por definição)
=
𝑧
𝑃𝑚 𝑌 = 𝑦 𝑋 = 𝑥, 𝑍 = 𝑧 𝑃𝑚 𝑍 = 𝑧 𝑋 = 𝑥
=
𝑧
𝑃𝑚 𝑌 = 𝑦 𝑋 = 𝑥, 𝑍 = 𝑧 𝑃𝑚 𝑍 = 𝑧
Exemplo: efeito de uma droga com
intervenção
 Usando as relações de invariância, obtemos uma
fórmula para o efeito causal, em termos das
probabilidades de pré-intervenção:
𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥
=
𝑧
𝑃 𝑌 = 𝑦 𝑋 = 𝑥, 𝑍 = 𝑧 𝑃 𝑍 = 𝑧
Este procedimento é conhecido como "ajustar para Z"
ou "controlar para Z."
Fórmula de ajuste: exemplo numérico
 Exemplo: efeito de uma droga com intervenção
 𝑋 = 1: o paciente que toma o medicamento,
 𝑍 = 1: o paciente é homem e
 𝑌 = 1: paciente em recuperação.
Gênero Usaram a nova droga Não usaram a nova droga
Masculino 81 de 87 se recuperaram (93%) 234 de 270 se recuperaram (87%)
Feminino 192 de 263 se recuperaram (73%) 55 de 80 se recuperaram (69%)
Total 273 de 350se recuperaram (78%) 289 de 350 se recuperaram (83%)
Tabela 1: Resultados de um estudo sobre uma nova droga, levando o gênero
em consideração.
Fórmula de ajuste: exemplo numérico
 Temos pela fórmula de ajuste que
𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1
= 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 1 𝑃 𝑍 = 1
+ 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 0 𝑃 𝑍 = 0
 Usando os dados da Tabela 1
𝑃 𝑍 = 1 =
87 + 270
700
= 0,51
𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 1 =
81
87
= 0,93103
𝑃 𝑍 = 0 =
263 + 80
700
= 0,49
𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 0 =
192
263
= 0,73004
Fórmula de ajuste: exemplo numérico
 Temos pela fórmula de ajuste que
𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1
= 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 1 𝑃 𝑍 = 1
+ 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 0 𝑃 𝑍 = 0
 Usando os dados da Tabela 1
𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1 = 0,93 × 0,51 + 0,73 × 0,49
= 0,832
Fórmula de ajuste: exemplo numérico
 Temos pela fórmula de ajuste que
𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 0
= 𝑃 𝑌 = 1 𝑋 = 0, 𝑍 = 1 𝑃 𝑍 = 1
+ 𝑃 𝑌 = 1 𝑋 = 0, 𝑍 = 0 𝑃 𝑍 = 0
 Usando os dados da Tabela 1
𝑃 𝑍 = 1 =
87 + 270
700
= 0,51
𝑃 𝑌 = 1 𝑋 = 0, 𝑍 = 1 =
234
270
= 0,86667
𝑃 𝑍 = 0 =
263 + 80
700
= 0,49
𝑃 𝑌 = 1 𝑋 = 0, 𝑍 = 0 =
55
80
= 0,6875
Fórmula de ajuste: exemplo numérico
 Temos pela fórmula de ajuste que
𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1
= 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 1 𝑃 𝑍 = 1
+ 𝑃 𝑌 = 1 𝑋 = 1, 𝑍 = 0 𝑃 𝑍 = 0
 Usando os dados da Tabela 1
𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 0 = 0,87 × 0,51 + 0,69 × 0,49
= 0,7818
Fórmula de ajuste: exemplo numérico
 Comparando o efeito de tomar a droga (𝑋 = 1) com
o efeito de não tomar (𝑋 = 0), obtemos
𝐴𝐶𝐸 = 𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1 − 𝑃 𝑌 = 1 𝑋 = 0
= 0,832 − 0,7818 = 0,0502
ACE: a diferença na fração da população que se
recuperaria se todos tomassem a droga em
comparação com quando ninguém toma a droga.
Fórmula de ajuste: outro exemplo
 Exemplo de pressão sanguínea do paradoxo de
Simpson
 Discutimos que o método mais sensível não seria
condicionar a pressão arterial, mas examinar a
tabela de população incondicional diretamente.
Como a fórmula de ajuste poderia lidar com
situações como essa?
 Pressão sanguínea
 RecuperaçãoUso do medicamento
Fórmula de ajuste: outro exemplo
 𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1 =?
 Pressão sanguínea
 RecuperaçãoUso do medicamento
Fórmula de ajuste: outro exemplo
 𝑃 𝑌 = 1 𝑑𝑜 𝑋 = 1 =?
 Primeiro, simulamos uma intervenção e examinamos a fórmula de
ajuste resultante da intervenção simulada.
 Como nenhuma ligação entra em 𝑋, já que 𝑋 não tem pais, não é
necessária nenhum “corte” no grafo.
 As condições em que os dados foram obtidos foram tais que o
tratamento foi atribuído "como se fosse randomizado".
 Se houvesse um fator que fizesse com que os indivíduos preferissem ou
rejeitassem o tratamento, esse fator deveria aparecer no modelo; a
ausência de tal fator nos permite tratar 𝑋 como um tratamento
aleatorizado.
 Sob tais condições, o grafo de intervenção é igual ao gráfico original
e a fórmula de ajuste se reduz a
𝑃 𝑌 = 𝑦 𝑑𝑜 𝑋 = 𝑥 = 𝑃 𝑌 = 𝑦 𝑋 = 𝑥
 Se ajustássemos pela pressão arterial, obteríamos uma avaliação
incorreta - correspondente a um modelo em que a pressão arterial fizesse
com que as pessoas buscassem tratamento.Ajustar por... Ou não ajustar?
 Entender qual variável, ou conjunto de variáveis, 𝑍
pode ser legitimamente incluído na Fórmula de
Ajuste.
 O procedimento de intervenção determina que 𝑍
deve coincidir com os pais de 𝑋, porque é a
influência desses pais que neutralizamos quando
corrigimos 𝑋 por manipulação externa.
 Seja 𝑃𝐴 𝑋 os pais de 𝑋.
Regra 1 (A Regra de Efeito Causal)
 Dado um grafo 𝐺 em que um conjunto de variáveis
𝑃𝐴 são designadas como pais de 𝑋, o efeito causal
de 𝑋 em 𝑌 é dado por
𝑃(𝑌 = 𝑦|𝑑𝑜 𝑋 = 𝑥 =
𝑧
𝑃 𝑌 = 𝑦 𝑋 = 𝑥, 𝑃𝐴 = 𝑧 𝑃 𝑃𝐴 = 𝑧
onde 𝑧 varia em todas as combinações de valores que
as variáveis na 𝑃𝐴 podem tomar.
Regra 1 (A Regra de Efeito Causal)
 Outra forma de expressa a Regra 1
𝑃(𝑌 = 𝑦|𝑑𝑜 𝑋 = 𝑥
=
𝑧
𝑃 𝑌 = 𝑦 𝑋 = 𝑥, 𝑃𝐴 = 𝑧 𝑃 𝑃𝐴 = 𝑧 ∙
𝑃 𝑋 = 𝑥|𝑃𝐴 = 𝑧
𝑃 𝑋 = 𝑥|𝑃𝐴 = 𝑧
= 𝑃 𝑦 𝑑𝑜 𝑥 =
𝑧
𝑃 𝑋 = 𝑥, 𝑌 = 𝑦, 𝑃𝐴 = 𝑧
𝑃 𝑋 = 𝑥|𝑃𝐴 = 𝑧
Escore de propensão
(Propensity score)
Observações
 Quais aspectos do grafo nos permitem prever os
efeitos causais a partir de dados observacionais.
Precisamos do grafo para determinar a identidade
dos pais de 𝑋!
 𝑋: o conjunto de fatores que, em condições não-
experimentais, seria suficiente para determinar o valor de
𝑋, ou a probabilidade desse valor.
Observações
 Na maioria dos casos práticos, o conjunto de pais de
𝑋 conterá variáveis não observadas que nos
impedirão de calcular as probabilidades condicionais
na Fórmula de Ajuste.
 Como veremos nas seções seguintes, podemos
ajustar para outras variáveis no modelo para
substituir os elementos não medidos de 𝑃𝐴 𝑋 .
Intervenções múltiplas e a regra do produto
truncado
 Ao derivar a Fórmula de Ajuste, assumimos uma
intervenção em uma única variável, 𝑋, cujos pais
foram “desconectados”, de modo a simular a
ausência de sua influência após a intervenção.
 No entanto, em políticas sociais e médicas
normalmente envolvem várias intervenções, ditando
o valor de várias variáveis simultaneamente.
Intervenções múltiplas e a regra do produto
truncado
 Regra da Decomposição do Produto
 A distribuição antes da intervenção para o modelo abaixo
é dada pelo produto
𝑃 𝑥, 𝑦, 𝑧 = 𝑃 𝑧 𝑃 𝑥 𝑧 𝑃 𝑦 𝑥, 𝑧
Intervenções múltiplas e a regra do produto
truncado
 Considerando a distribuição pós-intervenção,
representada pela figura abaixo, é dada pelo
produto
𝑃 𝑧, 𝑦 𝑑𝑜 𝑥 = 𝑃𝑚 𝑧 𝑃𝑚 𝑦 𝑥, 𝑧 = 𝑃 𝑧 𝑃 𝑦 𝑥, 𝑧
Intervenções múltiplas e a regra do produto
truncado
𝑃 𝑧, 𝑦 𝑑𝑜 𝑥 = 𝑃𝑚 𝑧 𝑃𝑚 𝑦 𝑥, 𝑧 = 𝑃 𝑧 𝑃 𝑦 𝑥, 𝑧
 Isso coincide com a Fórmula de Ajuste, porque para
avaliar 𝑃 𝑦 𝑑𝑜 𝑥 precisamos somar em 𝑧, o que dá
𝑃 𝑦 𝑑𝑜 𝑥 =
𝑧
𝑃 𝑧 𝑃 𝑦 𝑥, 𝑧
Fórmula do produto truncado ou g-fórmula
 Generalizando a Fórmula de Ajuste para múltiplas
intervenções, ou seja, intervenções que atribui
valores constantes a um conjunto de variáveis 𝑋.
𝑃 𝑥1, 𝑥2, … , 𝑥𝑛 𝑑𝑜 𝑥 =
𝑖
𝑃 𝑥𝑖 𝑝𝑎𝑖
para todo 𝑖 com 𝑋𝑖 não pertencente a 𝑋.
Exemplo
 suponha que uma interveção seja
realizada no modelo da Figura 1
fazendo 𝑋 = 𝑥 e 𝑍3 = 𝑧3.
 A distribuição pós-intervenção
(Figura 2) das outras variáveis no
modelo será
𝑃 𝑧1, 𝑧2, 𝑤, 𝑦 𝑑𝑜 𝑋 = 𝑥, 𝑍3 = 𝑧3
= 𝑃 𝑧1 𝑃 𝑧2 𝑃 𝑤 𝑥 𝑃 𝑦 𝑤, 𝑧3, 𝑧2
 onde eliminamos os fatores
𝑃 𝑥 𝑧1, 𝑧3 e 𝑃 𝑧3 𝑧1, 𝑧2 do
produto.
Fig. 1: Modelo sem
intervenção
Fig. 2: Modelo com
intervenção
Exercício

Modelos de Grafos e suas aplicações incompleto

UFJF

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Inferência Causal

Continue navegando

Outros materiais