3 Parâmetros Estatísticos Relacionados a Identificação Individual e ao Vínculo Genético

•

ESTÁCIO

Joyce Fernandes

06/04/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 42 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 42 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 42 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Genética Geral

844 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

DEFINIÇÃO
Cálculo de frequência alélica e frequência genotípica. Equilíbrio de Hardy-Weinberg. Amostragem populacional representativa e Probabilidade de identidade ao acaso ou aleatória (RMP). Cálculo da RMP e significado estatístico. Softwares e análises estatísticas aplicadas à genotipagem. Análise de vínculo genético. Paternidade. Índice de paternidade (IP) e probabilidade de paternidade (W).
PROPÓSITO
Para aqueles que atuam ou pretendem atuar como geneticistas forenses, a estatística é uma ferramenta básica, sem a qual os achados laboratoriais não se refletem em informações judicialmente úteis. Mesmo existindo uma série de softwares capazes de realizar cálculos estatísticos, é importante que o experto em Genética Forense saiba interpretar e apresentar os cálculos de forma clara em muitas situações de sua vida profissional.
PREPARAÇÃO
Antes de iniciar o conteúdo deste tema, tenha em mãos uma calculadora ou use a calculadora de seu smartphone ou computador. É importante ainda revisitar os conceitos básicos de Biologia Molecular e ter o entendimento prévio a respeito do genoma humano.
OBJETIVOS
MÓDULO 1
Aplicar os parâmetros estatísticos relacionados à identificação individual
MÓDULO 2
Relacionar os parâmetros estatísticos à
investigação de vínculo genético
INTRODUÇÃO
Para que as análises feitas em laboratório sejam aceitas em um tribunal, é necessário que as informações reveladas sejam tratadas estatisticamente para que se entenda e pondere claramente o peso da evidência. Para tanto, são necessários conhecimentos de genética de populações, além de acesso a estudos populacionais para o conhecimento das frequências alélicas.
Vale recordar, antes de iniciarmos, que o conteúdo genômico nuclear de uma célula humana autossômica é composto por cerca de 2,85 bilhões de nucleotídeos, sendo que apenas cerca de 3% possuem função codificadora conhecida, de acordo com o International Human Genome Sequencing Consortium (CONSORTIUM, 2004). A combinação aleatória dos milhares de genes torna cada ser humano único (GARCIA, 2009).
Lembre-se, ainda, de que em uma análise de DNA, para fins judiciais, todas as etapas são importantes e devem ser consubstanciadas na peça final, que será o parecer técnico ou laudo pericial.
MÓDULO 1
Aplicar os parâmetros estatísticos
relacionados à identificação individual.
INTRODUÇÃO
Em uma análise de Genética Forense, perguntas como estas são frequentemente realizadas:
· Quantos loci devem ser estudados?
· As similaridades entre os perfis são conclusivas?
· Qual é o índice de paternidade/razão de verossimilhança?
As genotipagens sendo similares, obrigatoriamente se originaram da mesma fonte? A conclusão de similaridade genética meramente descreve o fato de que não foram detectadas diferenças entre duas amostras através dos testes realizados (INMAN; RUDIM, 1997).
Nesse sentido, o presente módulo vai abordar os fundamentos de genética de populações e cálculos estatísticos mais comumente empregados neste campo.
ATENÇÃO
Antes de seguirmos, tenha em mente que, seja qual for a amostra ou fonte do material genético (sangue, sêmen, fios de cabelo com raiz ou outra), é preciso ter com o que comparar e que o resultado deve ser baseado na frequência dos alelos em dada população.
A Estatística Forense é a aplicação de modelos de probabilidade e técnicas estatísticas a evidências científicas. Em contraste com as aplicações estatísticas “cotidianas”, para que não gerem viés ou tirem indevidamente conclusões, os estatísticos forenses relatam probabilidades como razões de verossimilhança (RV ou likelihood ratio). Essa proporção de probabilidades é, então, usada por júris ou juízes para extrair inferências ou conclusões e decidir questões legais.
Os magistrados confiam na força de uma correspondência de DNA dada pelas estatísticas para tirar conclusões e determinar vereditos em questões legais.
CONCEITOS
Antes de avançarmos, é importante definirmos alguns conceitos básicos:
AMOSTRA
ALELO
FREQUÊNCIA
FREQUÊNCIA ALÉLICA
FREQUÊNCIA GENOTÍPICA
AMOSTRA
Subconjunto da população, fração ou uma parte do grupo;
ALELO
Formas alternativas de um mesmo gene;
FREQUÊNCIA
Número de ocorrências de um evento;
FREQUÊNCIA ALÉLICA
Frequência em que um determinado alelo aparece em uma população;
FREQUÊNCIA GENOTÍPICA
Frequência dos genótipos de dado gene em uma população.
Fonte: unsplash
EXEMPLO
Se, em uma população de 100 pessoas, 2 possuem determinado alelo X, a frequência de X será igual a 2/100, ou 0,02 (2%).
Vale recordar e aprofundar também algumas definições úteis:
PROBABILIDADE DE IDENTIDADE AO ACASO OU ALEATÓRIA (RMP)
As RMP são usadas para estimar e expressar a raridade de um perfil de DNA. Pode-se definir a RMP como sendo a probabilidade de que outra pessoa na população, escolhida ao acaso, tenha o mesmo genótipo que o genótipo do colaborador da evidência forense.
Esta análise é feita usando as frequências do genótipo em todos os loci, ou quão comuns ou raros são os alelos de um genótipo. As frequências do genótipo são multiplicadas em todos os locais, usando a regra do produto, para se chegar ao resultado.
A RMP só pode ser usada como estatística para descrever o perfil do DNA se for de uma única fonte ou se o analista for capaz de diferenciar no eletroferograma o pico dos contribuintes principais do pico dos secundários de uma mistura.
PROBABILIDADE COMBINADA DE INCLUSÃO (CPI)
Esta é uma estatística comum usada quando o analista não pode diferenciar entre os picos de um colaborador maior e menor em uma amostra e o número de colaboradores não pode ser determinado.
Esse cálculo estatístico é feito adicionando todas as frequências dos alelos observados e depois quadrando o valor, o que gera o valor da probabilidade de inclusão (PI). Esses valores são multiplicados em todos os locais, resultando no valor da CPI.
O valor é elevado ao quadrado para que todas as combinações possíveis de genótipos sejam incluídas no cálculo. Uma vez feito o cálculo, é realizada uma declaração sobre o significado desse cálculo.
Por exemplo, se o CPI calculado for 0,5, significa que a probabilidade de alguém escolhido aleatoriamente na população não ser excluído como contribuinte da mistura de DNA é 0,5.
A CPI está relacionada à evidência (a mistura de DNA) e não depende do perfil de nenhum suspeito. Portanto, a CPI é uma ferramenta estatística que pode ser usada para fornecer peso ou força à evidência quando nenhuma outra informação sobre o crime é conhecida.
Isso é vantajoso em situações em que os genótipos na mistura de DNA não podem ser distinguidos um do outro. No entanto, essa estatística não é muito discriminatória e não é uma ferramenta tão poderosa, como as razões de probabilidade e probabilidades de correspondência aleatória podem ser quando algumas informações sobre a mistura de DNA, a exemplo o número de colaboradores ou os genótipos de cada colaborador, podem ser distinguidas. Outra limitação ao CPI é que ele não é utilizável como uma ferramenta para a interpretação de uma mistura de DNA.
Podemos, agora, dar sequência ao módulo.
CÁLCULO DA FREQUÊNCIA ALÉLICA E FREQUÊNCIA ESTATÍSTICA
Fonte: pikisuperstar - freepik
Em decorrência do fato de que a tipagem de DNA é apenas um exame de sequência e/ou comprimento de uma amostra de DNA em regiões específicas, uma correspondência ou associação entre perfis é sempre um exercício estatístico.
Para determinar a probabilidade de um determinado genótipo ocorrer aleatoriamente em um grupo populacional, é preciso reunir dados da população e fazer estimativas acerca da frequência de cada alelo.
PROBABILIDADE DE UM DETERMINADO GENÓTIPO
A investigação de semelhanças e diferenças entre diferentes populações é um importante campo da ciência e tem suscitado numerosas publicações científicas. É cabível destacar que a população brasileira é altamente miscigenada.
No vídeo a seguir o professor apresentará mais detalhes a respeito do conceito de ‘Frequência Alélica’. Assista:
Observe a seguir a Tabela 1, retirada de um manual técnico de um dos kits de genotipagem mais usados no mundo,que retrata o impacto estatístico para diferentes fins do conjunto de marcadores incluídos.

Africano Americano
Caucasiano Americano
Hispânico Americano
Asiático Americano
Probabilidade de emparelhamento
1
1 in 1.83 x 1017
1 in 2.93 x 1017
1 in 3.74 x 1017
Índice de paternidade
2,510,000
1,520,000
572,000
4,110
Poder de exclusão
0.9999996
0.9999994
0.9999983
0.9999998
Tabela 1. Probabilidade de emparelhamento, índices de paternidade e poder de exclusão do sistema PowerPlex®16 (Promega, EUA) em várias populações. Fonte: Traduzido de Promega.
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
A Tabela 2 apresenta a frequência alélica referente ao locus Penta C (cromossomo 9) para diferentes grupos étnicos.
Quadro Resumo

Africano Americano
Americano Indiano
Asiático
Caucasiano
Hispânico
Alelo
Número
Frequência
Número
Frequência
Número
Frequência
Número
Frequência
Número
Frequência
5
9
0.015
22
0.037
20
0.033
4
0.007
12
0.020
6
0
*
1
0.002
0
*
0
*
0
*
7
18
0.030
1
0.002
2
0.003
1
0.002
3
0.005
9
101
0.168
138
0.230
183
0.305
95
0.158
148
0.247
10
38
0.063
24
0.040
31
0.052
38
0.063
26
0.043
10.1
0
*
0
*
0
*
0
*
1
0.002
11
162
0.270
198
0.330
221
0.368
258
0.430
161
0.268
12
153
0.255
125
0.208
84
0.140
112
0.187
152
0.253
13
59
0.098
46
0.077
22
0.037
83
0.138
63
0.105
14
20
0.033
6
0.010
2
0.003
3
0.005
10
0.017
15
3
0.005
0
*
0
*
2
0.003
1
0.002
16
0
*
1
0.002
0
*
0
*
0
*
17
1
0.002
0
*
0
*
0
*
0
*
Total
600
1.000
600
1.000
600
1.000
600
1.000
600
1.000
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Tabela 2 Frequências alélicas para o locus Penta C, em diferentes grupos étnicos. Fonte: Traduzido de Promega
Vale ressaltar que também deve-se ter em conta as taxas de heterozigose e se os loci em uma mesma análise são herdados ou não em conjunto (linkage ou ligação gênica ).
LIGAÇÃO GÊNICA
Dizemos que um gene está em linkage ou ligação gênica quando ele está em um mesmo cromossomo e não se segrega de forma independente no momento da formação de um gameta.
COMO OS CÁLCULOS FORENSES SÃO EFETUADOS?
Os cálculos forenses são convencionalmente efetuados de duas formas:
1) A probabilidade de uma coincidência aleatória > (probabilidade de identidade aleatória), calculada a partir das frequências dos marcadores de DNA em um banco de dados.
2) A razão de verossimilhança, que será definida mais adiante neste módulo.
ATENÇÃO
Conheça algumas convenções importantes:
Quando + é usado, significa OU; quando X é usado, significa e;
PR significa probabilidade;
Logo, a probabilidade de a e b acontecer conjuntamente é Pr(a e b) = a x b;
As probabilidades são condicionais, o que significa que a probabilidade é baseada em hipóteses ;
Em Matemática, o condicionamento é indicado por uma barra vertical, portanto Pr (a | b) significa a probabilidade de um dado b é verdade.
HIPÓTESES
O conceito de teste de hipóteses, teste estatístico ou teste de significância é um procedimento estatístico que permite tomar uma decisão (aceitar ou rejeitar a hipótese nula entre duas ou mais hipóteses (hipótese nula ou hipótese alternativa).
Em um caso de uma amostra encontrada em uma cena de crime, pode-se calcular a probabilidade de ela ser relacionada a um suspeito versus pertencer a um desconhecido.
Fonte: vectorpouch - freepikFonte: vectorpouch - freepik
SE PR (A|S) = 0,02 E PR (A|D) = 0,98, LOGO, RV = 0,02041.
 Atenção! Para visualização completa da equação utilize a rolagem horizontal
Se compararmos isso com os alelos em determinado locus, as frequências de cada alelo não são idênticas, como no exemplo do dado. Portanto, é preciso conhecer as frequências de cada alelo na população ou, em outras palavras, a probabilidade de alguém ao acaso na população apresentar tal alelo.
ATENÇÃO
A comunidade científica forense tem procurado cada vez mais métodos quantitativos para transmitir o peso das evidências. Especialistas de muitos laboratórios forenses resumem seus resultados em termos de uma razão de verossimilhança.
Vamos consultar a Tabela 2, referente aos alelos do locus Penta C e suas respectivas frequências que vimos anteriormente. Observe o alelo 10 e verifique a sua frequência para os grupos de afro-americanos (AA) e de hispânicos (H).
Frequências alélicas para o locus Penta C, em diferentes grupos étnicos

Africano Americano
Americano Indiano
Asiático
Caucasiano
Hispânico
Alelo
Número
Frequência
Número
Frequência
Número
Frequência
Número
Frequência
Número
Frequência
10
38
0.063
24
0.040
31
0.052
38
0.063
26
0.043
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Notou algo?
RESPOSTA
As frequências não são as mesmas. Conforme a tabela, temos 0,063 ou 6,3% para AA e 0,043 (ou 4,3%) para H. Ou seja, para este último grupo a chance de uma pessoa não apresentar referido alelo 10 é de 100 - 4,3 = 95,7%.
AFINAL, COMO CALCULAMOS A RAZÃO DE VEROSSIMILHANÇA?
A razão de verossimilhança se dá entre a probabilidade de se obter uma identidade de perfis genéticos, quando o DNA na amostra da prova e do suspeito vierem da mesma pessoa, e a probabilidade de uma identidade se as amostras de DNA derivarem de indivíduos distintos (Figura 1).
Fonte:freepikFigura 1. Fluxo resumido da análise de uma amostra obtida de cena de crime. Fonte: macrovector em freepik
SAIBA MAIS
A razão da verossimilhança entre a hipótese da acusação e da defesa representa a força da evidência que a análise de DNA apresenta. O índice de paternidade, por exemplo, é uma razão de verossimilhança e consiste na probabilidade de combinação do perfil mãe-filho-pai, se o suposto pai for o pai verdadeiro, dividido pela probabilidade desta combinação, se um homem aleatoriamente escolhido ser o pai biológico. No caso de identificação humana por DNA, temos que uma razão de verossimilhança de 1.000 significa que é 1.000 vezes mais provável obter uma identidade dos perfis se as amostras de DNA vierem da mesma pessoa do que se elas se originaram de dois indivíduos quaisquer aleatoriamente escolhidos da população.
EQUILÍBRIO DE HARDY-WEINBERG: FUNDAMENTOS E PREMISSAS
O que é o equilíbrio de Hardy-Weinberg? Quais são os fatores ou forças que podem perturbá-lo? Vamos conhecer um pouco mais a esse respeito.
No campo da Genética de Populações, o princípio de Hardy-Weinberg, também conhecido como equilíbrio, princípio, modelo, teorema ou lei de Hardy-Weinberg, criado em 1908 pelo matemático Godfrey Hardy e pelo médico Wilhelm Weinberg, afirma que: as frequências de alelos e genótipos em uma população permanecerão constantes de geração em geração na ausência de outras influências evolutivas.
O equilíbrio de Hardy-Weinberg pode ser perturbado por várias forças, incluindo mutações, seleção natural, acasalamento não aleatório, desvio genético e fluxo gênico.
EXEMPLO
Por exemplo, mutações perturbam o equilíbrio das frequências alélicas ao introduzir novos alelos em uma população. Da mesma forma, a seleção natural e o acasalamento não aleatório interrompem o equilíbrio de Hardy-Weinberg porque resultam em alterações nas frequências dos genes. Isso ocorre porque certos alelos ajudam ou prejudicam o sucesso reprodutivo dos organismos que os transportam.
Outro fator que pode perturbar esse equilíbrio é a deriva genética, que ocorre quando as frequências dos alelos aumentam ou diminuem por acaso e geralmente ocorrem em pequenas populações. O fluxo gênico, que ocorre quando o cruzamento entre duas populações transfere novos alelos para uma população, também pode alterar o equilíbrio de Hardy-Weinberg.
Como todas essas forças perturbadoras geralmente ocorrem na natureza, o equilíbrio de Hardy-Weinberg raramente se aplica na realidade. Portanto, o equilíbrio de Hardy-Weinberg descreve um estado idealizado, e variações genéticas na natureza podem ser medidas como mudanças desse estadode equilíbrio.
Algumas premissas devem ser consideradas para uma população se enquadrar no princípio de Hardy-Weinberg, como ser consideravelmente grande e apresentar o mesmo número de machos e fêmeas.
Cada casal deve ser igualmente fértil e, portanto, capaz de produzir o mesmo número de indivíduos na sua prole. Todos os cruzamentos devem se dar de modo aleatório. Por fim, não podem ocorrer mutações, força da seleção natural e fluxo gênico.
ATENÇÃO
Portanto, somente uma população teórica, não natural, poderia atender a esse princípio.
AMOSTRAGEM POPULACIONAL REPRESENTATIVA E PROBABILIDADE DE IDENTIDADE ALEATÓRIA, SEU CÁLCULO E SIGNIFICADO ESTATÍSTICO
Antes de avançarmos para o próximo módulo, é preciso ainda acrescentar alguns conceitos ao nosso estudo.
O ponto inicial a ser definido neste contexto é o de população estatística, tida por conjunto de itens, pessoas ou elementos de forma geral que contém todas as informações disponíveis para fazer um determinado tipo de inferência, sobre a qual se pode concluir algo.
Junto a isso, temos o conceito de amostragem, processo que segue técnicas para selecionar membros de uma população de forma que seja possível inferir sobre toda a população. Para que qualquer generalização ou inferência seja feita sobre a população, a amostra deve ser uma parcela representativa da população. Para isso, existem diferentes técnicas de cálculo para a amostra usando um subgrupo da população.
Conforme mencionado, a probabilidade de identidade aleatória ̶ probabilidade de identidade ao acaso ou aleatória (RMP) é calculada a partir das frequências dos marcadores de DNA em um banco de dados. Para tanto, deve-se estimar a probabilidade de outra pessoa apresentar aquele mesmo conjunto de alelos do indivíduo que está sendo observado e a força (frequência estimada) deste achado.
PONTO DE REFLEXÃO
Fonte: kjpargeter em freepik.
A tipagem genética de indivíduos baseada na análise de regiões hipervariáveis do DNA tem alto poder de discriminação.
Se o perfil genético encontrado em uma evidência biológica é igual ao de um suspeito, isso pode representar que a evidência tem como fonte aquela pessoa, dependendo da frequência na população dos alelos tipados ou ainda pode representar que houve um emparelhamento (igualdade de perfis) ao acaso entre indivíduos distintos.
A probabilidade de emparelhamento indica a possibilidade de se encontrar dois indivíduos com o mesmo perfil genético, e alcança valores de 1×1012. Uma vez que vários padrões de DNA podem emparelhar uns com os outros.
A correta identificação depende do conhecimento da frequência com que tais padrões ocorrem na população avaliada. Em um tribunal, a apresentação do perfil genético de uma evidência geralmente vem acompanhada de proposições numéricas.
O princípio de Hardy-Weinberg afirma que as frequências de alelos e genótipos em uma população permanecerão constantes de geração em geração na ausência de outras influências evolutivas.
VERIFICANDO O APRENDIZADO
MÓDULO 2
Relacionar os parâmetros estatísticos
à investigação de vínculo genético.
ANÁLISE DE UM CASO HIPOTÉTICO
O vínculo genético entre dois indivíduos pode ser investigado em várias situações, como:
· Paternidade com ou sem a presença da mãe;
· Análise de maternidade, paternidade com suposto pai ausente (reconstituição a partir de outros parentes, como avós ou tios).
Vamos ver um caso hipotético para compreender melhor.
PRESENÇA DA MÃE
Situação TRIO, contendo mãe biológica, filho(s) e suposto pai (SP);
Situação DUO (SP e filho, somente).
Fonte: pikwizard
Imagine um exame de paternidade (identificação de vínculo genético) na modalidade TRIO – mãe (M), filho (C, probando) e suposto pai (SP) –, em que parte dos dados disponíveis, hipoteticamente, são:
Probando é um termo usado em genética médica e forense e em outros campos da Medicina para designar um indivíduo particular que estiver sendo estudado ou reportado.
Observe a seguir a Tabela 1, retirada de um manual técnico de um dos kits de genotipagem mais usados no mundo, que retrata o impacto estatístico para diferentes fins do conjunto de marcadores incluídos.

REGIÃO
AMOSTRA

D1S533
TPOX
D3S1744
FGA
CSF1PO
F13A01

SP
8/8
8/8
15/18
23/26
11/12
4/6

C
8/8
8/8
17/18
23/24
11/12
5/6

M
8/14
8/10
17/19
24/24
9/12
5/5

FREQUÊNCIA
0,12
0,46
0,43
0,12
0,30
0,33

IP
8,33
2,17
1,16
4,16
1,66
1,51
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Sendo a a frequência de dado alelo na população, temos as fórmulas a serem empregadas para o cálculo do índice de paternidade (IP):
a) Em caso de o alelo em questão ser expresso em homozigose:
IP=1/a
b) Em caso de o alelo em questão ser expresso em heterozigose:
IP=1/2.a
Dessa forma, conforme apresentado neste caso, o cálculo do IP para o locus D1S533 pode ser obtido assim:
IP = 1 / 0,12
IP = 8,33
Ainda considerando os dados deste exemplo, o IP para o locus D3S1744 (cromossomo 3) seria calculado desta forma:
IP = 1 / (2.0,43)
IP = 1,16
Note-se que, quanto maior a frequência de um dado alelo, menor seu impacto no IP, uma vez que retratará um achado comum.
Na sequência, pode-se estimar o índice de paternidade cumulativo (IPcumIPcum) pelo produto dos IP. Ainda seguindo nosso exemplo, teríamos:
PRODUTO
Resultado da multiplicação de todos os IP.
IPcum = 8,33 x 2,17 x 1,16 x 4,16 x 1,66 x 1,51 = 258,64IPcum = 8,33 x 2,17 x 1,16 x 4,16 x 1,66 x 1,51 = 258,64
Após se chegar ao IPcumIPcum, a probabilidade de paternidade percentual ou probabilidade cumulativa positiva de paternidade (W) pode ser, então, calculada conforme a seguir:
W = IPcum / (IPcum + 1)W = IPcum / (IPcum + 1)
W = 258,64 / (258,64+1), logo,W = 258,64 / (258,64+1), logo,
W = 99,6%W = 99,6%
ATENÇÃO
Internacionalmente, observa-se o aceite como:
· Provável paternidade, probabilidades de 90 – 94,9%;
· Forte indício de paternidade, entre 95 – 99,8%; e
· 99,9% ou acima, dependendo do tamanho da população, se confirma a paternidade.
A probabilidade de 99% representa índice ou “certeza” de 1/100; 99,9% de 1/1.000; 99.99% de 1/10.000 e assim por diante. Para casos de exclusão de paternidade, consideram-se as situações de três ou mais loci sem o SP apresentar o Alelo paterno obrigatório (APO).
ALELO PATERNO OBRIGATÓRIO (APO)
Em dada região na análise de vínculo paterno, no perfil do filho, quando um alelo coincide com o da mãe, o outro é o APO. Isto é, na análise, quando excluímos o alelo da mãe a partir do conjunto de alelos do filho, o que sobrar é o do pai, obrigatoriamente.
Nos casos em justiça em que não há exclusão da paternidade, o laudo pericial deve incluir, de forma obrigatória, o índice de paternidade para cada sistema genético empregado, o índice de paternidade final e a probabilidade de paternidade, sendo destacadas as premissas e probabilidades utilizadas a priori.
PROBABILIDADES UTILIZADAS A PRIORI
Valor subjetivo da chance de paternidade anterior ao teste. Trata-se de um dado essencial para o cálculo de acordo com as regras do teorema.
Probabilidades a priori constantes (0,5) têm sido consensualmente utilizadas globalmente.
Possíveis resultados advindos de um teste de paternidade conclusivo:
Inclusão:
Os alelos paternos obrigatórios no filho correspondem integralmente ao perfil do alegado pai.
Exclusão:
Os alelos paternos obrigatórios no filho não correspondem integralmente ao perfil do alegado pai.
No vídeo a seguir o professor vai dar mais detalhes sobre a ‘Exclusão de suspeito’ no teste de paternidade conclusivo. Assista:
MAIS UM EXEMPLO
Vamos agora obter o IP para as regiões colocadas a seguir, na Figura 2, considerando uma investigação de paternidade, na modalidade TRIO, SP, M e F, usando os dados da Tabela 2 (locus Penta C) para o grupo caucasiano.
Frequências alélicas para o locus Penta C, em diferentes grupos étnicos

Caucasiano
Alelo
Número
Frequência
5
4
0.007
6
0
*
7
1
0.002
8
4
0.007
9
95
0.158
10
38
0.063
10.1
0
*
11
258
0.430
12
112
0.187
13
83
0.138
14
3
0.005
15
2
0.00316
0
*
17
0
*
Total
600
1.000
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Figura 2 – Alelos para o locus Penta C, para SP, F e M, no exemplo a ser estudado:
Pessoa analisada
Alelo(s) obtido(s)
SP
9 e 14
F
9 e 15
M
11 e 15
Frequência do alelo paterno obrigatório
0,158
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Sendo o alelo 9 o alelo paterno obrigatório, temos:
Como vimos, no conjunto de alelos do filho, excluindo-se aquele que representa a contribuição da mãe, o outro é dito “alelo paterno obrigatório”.
IP = 1 / 2.a
Logo:
IP = 1 / (2 . 0,158)
IP = 3,16
Usando ainda este mesmo exemplo, vamos calcular o IP considerando os dados para a população hispânica. Qual foi o resultado encontrado? Como podemos interpretar a diferença do resultado que obtivemos para o exposto no exemplo para o grupo caucasiano?
IP = 1 / 2.a
IP = 1 / (2 . 0,247)
IP = 2,02
Frequências alélicas para o locus Penta C, em diferentes grupos étnicos

Hispânico
Alelo
Número
Frequência
5
12
0.020
6
0
*
7
3
0.005
8
23
0.038
9
148
0.247
10
26
0.043
10.1
1
0.002
11
161
0.268
12
152
0.253
13
63
0.105
14
10
0.017
15
1
0.002
16
0
*
17
0
*
Total
600
1.000
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Resposta: IP = 2,02. Podemos observar que, entre os grupos étnicos diferentes, ocorre variação nas frequências alélicas, o que afeta diretamente o cálculo, por exemplo, do índice de paternidade em um caso desta natureza.
Fonte: unsplash
ATENÇÃO
IMPLICAÇÕES DE CORRELAÇÕES GENÉTICAS ENTRE APARENTADOS
Por causa das leis da herança mendeliana, os genótipos de parentes biológicos são muito mais semelhantes do que os de indivíduos aleatórios. Pais e filhos compartilham exatamente um alelo idêntico em cada locus, irmãos compartilham uma média de um alelo idêntico por locus, e avós e netos compartilham uma média de 0,5 alelos idênticos por locus
ALELO IDÊNTICO
Aqui, idêntico se refere à identidade por descendência de um ancestral comum. Os parentes podem compartilhar alelos adicionais simplesmente por acaso. Esses fatos têm consequências importantes para a tipagem de DNA.
Nota: Para a avaliação de W, considera-se a probabilidade a priori de paternidade (PP) e o Índice cumulativo de paternidade.
PROBABILIDADE A PRIORI DE PATERNIDADE (PP)
Como vimos, convenção de 0,5 ou 50% de o suposto pai ser o pai verdadeiro.
Este exemplo foi construído para ilustrar a sequência da análise, sendo os dados hipotéticos. Todavia, a partir dessa análise, pode-se chegar a duas premissas:
1) Quanto maior o número de regiões analisadas e a sua variabilidade, maior deverá ser a certeza estatística da análise;
2) Quanto menor a frequência de um dado alelo, maior será a sua implicância para a determinação de vínculo genético ou identificação humana.
SOFTWARES E ANÁLISES ESTATÍSTICAS APLICADAS À GENOTIPAGEM
Fonte: creativeart em freepik.
Existem diversas publicações contendo frequências alélicas para diversos marcadores de uso rotineiro em Genética Forense e para distintos grupos étnicos, linguísticos ou populacionais. Muitas inferências podem ser feitas a partir desses dados.
O manejo das análises estatísticas pode ser feito manualmente ou com o apoio de softwares. Há alguns que são de acesso livre na internet, como:
· ENFSI DNA WG STR Population Database;
· Canadian Random Match Calculator for Profiler Plus and COfiler kits.
No podcast a seguir o professor fala mais detalhadamente sobre softwares específicos para analises estatisticas. Escute:
DICA
A webpage da International Society for Genetic Forensics (ISGF) é uma fonte confiável de informações e disponibiliza links constantemente atualizados a respeito de softwares de análise estatística aplicáveis à genética forense.
A ISGF apoia projetos de softwares para análises estatísticas de uso liberado ou open source. Para quem deseja se aprofundar no tema, é recomendável a leitura das recomendações da ISGF para a validação de softwares para cálculos com aplicações em genética forense. Nesse sentido, também são de grande importância os bancos de dados de DNA, tal qual o CODIS, que veremos a seguir.
BANCOS DE DADOS DE DNA
A expressão inglesa DNA fingerprinting ficou famosa após a divulgação dos trabalhos realizados pelo britânico Alec Jeffreys, na década de 1980. Muitos avanços ocorreram a partir daí, incluindo a criação de bancos de dados de DNA (informações de perfis genéticos).
Fonte: vectorpouch freepik
Esses sistemas servem para armazenamento, busca e cruzamento de informações, sendo ferramentas investigativas eficientes. Em parte da Europa e dos EUA, existem bancos de dados de DNA para diversos fins já em funcionamento, e a padronização de técnicas e troca de informações é encorajada.
Nos Estados Unidos da América, o banco de dados do FBI (Federal Bureau of Investigation) conhecido como CODIS (Combined DNA Index System) tem informações genéticas de criminosos condenados pela justiça e outras obtidas em cenas de crimes. Essa ferramenta é empregada na resolução de crimes violentos, pois permite o cruzamento de informações genéticas de modo eletrônico.
CODIS
Essa importante ferramenta, muito famosa por meio de diversas citações em seriados de televisão que têm as análises periciais como parte do enredo, reúne ciência forense e tecnologia da computação, permitindo a comparação de perfis de DNA eletronicamente.
Uma das suas aplicações é gerar pistas nos casos em que evidências biológicas são recuperadas da cena de um crime, podendo, inclusive, relacionar diferentes crimes e identificar infratores em série. Com base em uma análise de dados, policiais de várias jurisdições podem coordenar suas respectivas investigações e compartilhar as pistas que desenvolveram independentemente.
O CODIS, no FBI, começou como um projeto piloto de software em 1990, atendendo 14 laboratórios estaduais e locais. A Lei de Identificação de DNA de 1994, nos EUA, formalizou a autoridade do FBI de estabelecer um Sistema Nacional de Índice de DNA (NDIS) para fins de aplicação da lei. Hoje, mais de 190 laboratórios públicos de aplicação da lei participam do NDIS nos Estados Unidos. Internacionalmente, mais de 90 laboratórios policiais em mais de 50 países, incluindo o Brasil, usam o software CODIS para suas próprias iniciativas de banco de dados.
As coincidências encontradas entre o perfil genético de duas ou mais amostras no banco de dados podem demonstrar a ligação entre cenas de crimes e criminosos, muitas vezes apontando para a ocorrência de eventos em série, como assassinatos cometidos por um serial killer.
Nesse ponto, devemos lembrar que o peso de coincidências entre perfis genéticos deve ser ponderado com ferramentas estatísticas. Com base nisso, as forças da lei podem direcionar as suas ações investigativas, tornando mais ágil o processo e, até mesmo, exonerando suspeitos mais rapidamente.
Em 1999, a Espanha se tornou o primeiro país a iniciar de forma oficial um programa nacional para a identificação de restos mortais humanos que não pudessem ser analisados por métodos forenses tradicionais.
Uma importante iniciativa naquele momento foi a criação do Programa FENIX, um banco de dados contendo informações genéticas de parentes de pessoas desaparecidas como referência para a comparação com evidências em questionamento (MELGAÇO; FIGUEIREDO; PARADELA, 2007).
ATENÇÃO
O CODIS utiliza um conjunto mínimo de 13 loci, com alto poder de discriminação e independentemente segregados (o que significa, em linhas gerais, que ter um certo número de repetições em um marcador não altera a probabilidade de haver qualquer número de repetições em qualquer outro).
Isso permite que a regra do produto para probabilidades possa ser aplicada, significando que, se alguém tem o tipo de DNA do ABC, onde os três locos eram independentes, podemos dizer que a probabilidade de ter esse tipo de DNA é:
A probabilidade de ter o tipo A x A probabilidade de ter o tipo B x A probabilidade de tertipo C.
Os referidos marcadores STR são: CSF1PO, FGA, TH01, TPOX, vWA, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51 e D21S11.
DECRETO 7.950 /2013
O Decreto 7.950 /2013 (BRASIL, 2013) criou o Banco Nacional de Perfis Genéticos e a Rede Integrada de Bancos e Perfis Genéticos. Observe abaixo o seu artigo primeiro:
Art. 1º Ficam instituídos, no âmbito do Ministério da Justiça, o Banco Nacional de Perfis Genéticos e a Rede Integrada de Bancos de Perfis Genéticos.
§ 1º O Banco Nacional de Perfis Genéticos tem como objetivo armazenar dados de perfis genéticos coletados para subsidiar ações destinadas à apuração de crimes.
§ 2º A Rede Integrada de Bancos de Perfis Genéticos tem como objetivo permitir o compartilhamento e a comparação de perfis genéticos constantes dos bancos de perfis genéticos da União, dos Estados e do Distrito Federal.
§ 3º A adesão dos Estados e do Distrito Federal à Rede Integrada ocorrerá por meio de acordo de cooperação técnica celebrado entre a unidade federada e o Ministério da Justiça.
§ 4º O Banco Nacional de Perfis Genéticos será instituído na unidade de perícia oficial do Ministério da Justiça, e administrado por perito criminal federal habilitado e com experiência comprovada em genética, designado pelo Ministro de Estado da Justiça.
Ainda conforme esse decreto, já em seu artigo segundo, ficou estabelecido que a Rede Integrada de Bancos de Perfis Genéticos contará com um Comitê Gestor, com a finalidade de promover a coordenação das ações dos órgãos gerenciadores de banco de dados de perfis genéticos e a integração dos dados nos âmbitos da União, dos Estados e do Distrito Federal.
OUTROS SOFTWARES USADOS EM LABORATÓRIOS DE BIOLOGIA MOLECULAR E/OU GENÉTICA FORENSE
Existem outros tipos de softwares envolvidos no apoio ao geneticista forense. Entre eles, podem-se destacar:
GENEMAPPER SOFTWARE E O PEAK SCANNER SOFTWARE
Usados para indicar o tamanho de fragmentos de DNA em análises de genotipagem. Estes são pacotes flexíveis de software de genotipagem que fornecem dimensionamento de DNA e de alelos baseados em eletroforese. O GeneMapper é especialista em funcionalidades de múltiplas aplicações, incluindo polimorfismo de comprimento de fragmento amplificado, perda de heterozigosidade, microssatélites e análises de genotipagem SNP. Estes softwares podem ajudar os usuários a aumentarem a eficiência do processamento de dados com autoanálise remota e operação de linha de comando, além de permitirem a implantação multiusuário, cliente-servidor. Os softwares permitem a identificação automatizada de alelos, o que reduz o tempo de revisão de dados para genotipagem de alto rendimento. Uma alternativa a estes produtos é o OSIRIS software.
CLUSTAL
O alinhamento de sequência refere-se ao procedimento de comparar duas ou mais sequências procurando uma série de caracteres (nucleotídeos para sequências de DNA ou aminoácidos para sequências de proteínas) que aparecem na mesma ordem nas sequências de entrada. Existe uma série de programas de bioinformática para alinhamento de sequências. O Clustal é mais usado em laboratórios de pesquisa, permitindo múltiplos alinhamentos. Na área forense, seu emprego estaria mais associado à microbiologia e pode ainda ser usados para análise de DNA mitocondrial, embora existam outras opções para esta última.
BLAST
É uma ferramenta para calcular similaridade de sequências, mas que serve para identificar a localização de uma sequência ou, conforme o tópico anterior, identificar similaridades.
Alguns exemplos de softwares para análise estatística em Genética Forense open source são:
· DNAxs 2.0 – com intuito de auxiliar o geneticista forense, comparar perfis e aplicar modelos probabilísticos;
· DNA mixtures – analisa amostras contendo como fonte um ou mais doadores;
· MixtureCalc v1.2 – baseado no Excel, usa os dados exportados do GeneMapper para prover análises estatísticas.
As genotipagens de regiões STR por meio da técnica da PCR (reação em cadeia da polimerase) ou das regiões VNTR podem apresentar similaridades em três circunstâncias:
1. AS AMOSTRAS TÊM A MESMA FONTE:
a evidência biológica (mancha de sangue, saliva, esperma etc.) se origina da mesma pessoa que cedeu a amostra utilizada como referência;
2. A SIMILARIDADE É COINCIDÊNCIA:
o doador da amostra referência e o verdadeiro doador do material biológico têm alelos coincidentes em relação aos marcadores examinados;
3. A SIMILARIDADE É ACIDENTAL:
isso decorre de erros durante os processos de coleta e/ou análise das amostras.
Em cada uma delas, é preciso aplicar as análises estatísticas para dar o devido peso ao resultado e para que ele possa ser mais facilmente compreendido pelos operadores da Lei.
O QUÃO COMPLEXA PODE SER A ANÁLISE DE AMOSTRAS CONTENDO MISTURAS?
Existem casos de grande complexidade. Em casos de abuso sexual e em cenas de múltiplos assassinatos, por exemplo, é comum a análise de amostras contendo mistura de DNA de duas ou mais pessoas.
MISTURA DE DNA
Nas ciências forenses, as evidências de DNA recebidas para a criação de perfis de DNA por vezes contêm uma mistura de mais de uma pessoa. Os perfis de DNA são gerados usando um procedimento definido, no entanto a interpretação de um perfil de DNA se torna mais complicada quando a amostra contém uma mistura de DNA.
(FONTE, 2020)
Conforme já vimos, o processo de análise forense de DNA envolve diversas etapas. Em todas é importante seguir rígidos critérios. Para cada resultado, deve-se calcular a representatividade estatística, lembrando que tudo depende da frequência dos alelos encontrados em determinado grupo populacional.
É importante observar que, em uma mistura, várias combinações de genótipos podem ser consideradas, de acordo com cada situação, gerando complexidade ao exame.
Existem diferentes estratégias para tratamento estatístico de misturas. Tais metodologias levam em consideração diferentes hipóteses para construção do perfil alélico em misturas como a encontrada no esfregaço vaginal da vítima de um crime sexual.
PONTO DE REFLEXÃO
Erros técnicos e interpretativos podem ocorrer ao longo de um exame de DNA. São muitos os exemplos disponíveis na literatura especializada ao longo dos últimos vinte anos. Um desses casos indica a inclusão de dois homens na qualidade de pai biológico de uma mesma criança (GONZÁLES-ANDRADE et al., 2009).
Outros exemplos de erros técnicos e/ou interpretativos são apresentados em trabalho de Melgaço et al., 2007. Tais questões levantam debate sobre a importância de se contar com um especialista para verificar e interpretar os exames forenses de DNA.
Você já parou para refletir sobre a importância de escolher os métodos mais indicados para um exame?
Há ainda situações em que as circunstâncias aumentam o grau de dificuldade do exame. A ausência do suposto progenitor masculino em uma investigação de paternidade, por exemplo, faz com que sejam buscadas estratégias investigativas especiais para a reconstituição do perfil genético do SP.
Os resultados dessa perícia dependem do sucesso na reconstituição dos genótipos da pessoa morta ou ausente. O grau de confiança do resultado dependerá do número de indivíduos analisados, dos vínculos genéticos que mantêm entre si e em relação à pessoa falecida/ausente, e da quantidade de loci analisados.
ATENÇÃO
Pense nisto, não basta ter acesso às ferramentas, é preciso conhecimento para fazer as escolhas certas.
VERIFICANDO O APRENDIZADO
CONCLUSÃO
CONSIDERAÇÕES FINAIS
Vimos neste tema que a Estatística Forense é a aplicação de modelos de probabilidade e técnicas estatísticas para a análise de uma evidência, como uma amostra de DNA em cena de crime. As razões das probabilidades são usadas por júris e juízes para estabelecer inferências ou conclusões e decidir questões legais. Tais decisões são tão importantes que podem presumir a inocência ou culpabilidade de uma pessoa.
A base da variabilidade genética é a ocorrência de mutações. A interpretação de uma análise de tipagem de DNA requer um método científico válido para estimar a probabilidade de uma pessoa aleatória, poracaso, corresponder à amostra forense nos loci examinados. Tais inferências devem se basear nas frequências alélicas de uma população e corresponder a uma hipótese (a ser aceita ou refutada).
Seja qual for o objeto de investigação, é determinante para o seu sucesso que as ferramentas estatísticas corretas sejam empregadas. Há casos históricos na Genética Forense que foram desconstruídos em julgamentos por conta de uso de métodos falhos e inapropriados, apesar de investigações laboratoriais corretas.