Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE TÉCNICA DE LISBOA Instituto superior de Agronomia GENÉTICA QUANTITATIVA A. Martins e J. Neves Martins CBBA, 2010 ___________________________________________________________________� ÍNDICE 1. INTRODUÇÃO 2 2. DETERMINISMO DAS CARACTERÍSTICAS QUANTITATIVAS 2 3. ANÁLISE DA VARIABILIDADE DAS CARACTERÍSTICAS QUANTITATIVAS 8 3.1. Desvio ambiental 8 3.2. Desvio de dominância. Efeito médio e valor reprodutivo 11 3.3. Desvio de interacção 17 4. VARIÂNCIA DOS VALORES GENOTÍPICOS E REPRODUTIVOS. HERITABILIDADE E RESPOSTA. 18 4.1. Noção de heritabilidade 18 4.2. Cálculo da heritabilidade 21 4.3. Resposta à selecção 29 1. INTRODUÇÃO Como é de observação corrente, em populações de seres vivos há certas características que apresentam distribuições discretas, enquanto outras apresentam distribuições contínuas. O carácter asa normal versus asa vestigial em Drosophila não contém gradações intermédias, todos os indivíduos duma população caem dentro de uma ou outra dessas duas classes discretas. O mesmo acontece com numerosas outras características que frequentemente temos referido para fins exemplificativos no âmbito do estudo da genética mendeliana (rugosidade e cor das sementes da ervilheira, forma dos olhos em Drosophila, cor da pelagem dos coelhos, tipos sanguíneos do homem...).Situação inteiramente diversa ocorre, por exemplo, com a característica altura numa população humana. Se essa população for suficientemente numerosa e a escala de medição adequada, a distribuição de frequência das classes de altura tenderá para a continuidade à medida que se reduzirem os respectivos intervalos. A distribuição do tipo de asa em Drosophila é pois uma distribuição discreta e a distribuição das alturas numa população humana é uma distribuição contínua. Esta dualidade de situações foi já notada pelos primeiros geneticistas, na 2ª metade do século passado, porém, a compreensão dos mecanismos genéticos de controlo das características de distribuição contínua exigiria uma abordagem mais complexa relativamente aos conhecimentos da época. A genética das características de variação discreta foi portanto a que mais se desenvolveu nos primeiros tempos e, durante um certo período, pensou-se mesmo que os mecanismos da herança poderiam ser essencialmente diferentes num caso e no outro. 2. DETERMINISMO DAS CARACTERÍSTICAS QUANTITATIVAS Galton, no fim do século 19, foi o primeiro a analisar o problema da genética dos caracteres de variação contínua mas só alguns anos mais tarde Jule, Joahnsen, Nilsson-Ehle, East e outros apresentaram contribuições decisivas para a sua inteira compreensão. Essas contribuições conduziram à chamada hipótese dos factores múltiplos. Segundo esta hipótese, o controlo de certas características por numerosos genes de acção cumulativa - ao contrário das características de variação discreta, tidas como de controlo monogénico - seria bastante para explicar a continuidade das respectivas distribuições em populações segregantes. Não haveria portanto contradição entre a genética mendeliana e o então novo ramo da genética da variação contínua, nem tão pouco existiriam genes de outra natureza fundamentalmente diferente da dos já conhecidos. Com base em conhecimentos elementares de genética mendeliana é hoje fácil compreender a hipótese dos factores múltiplos, em toda a sua importância e simplicidade. Para isso, tomando uma qualquer característica de determinada espécie, em segregação numa população F2, vamos considerar sucessivamente que o seu controlo depende desde um até 4 genes de acção cumulativa (ou seja, os genes têm uma acção associativa, e não epistática, para a definição do nível da característica), podendo os alelos de cada um exibir ou não relações de dominância/recessividade. Consideremos ainda que a característica é uma altura e que os seus valores extremos são 4 e 10 metros. 1ª situação: um gene, exibindo dominância interalélica. Então teremos: valor de AA = Aa = 10m 3 valor de aa = 4m Nestas condições, a F2 apresentará uma distribuição discreta de frequência de classes de altura, como se indica: 3/4(AA+Aa) - 10m 1/4(aa) - 4m 0 0,2 0,4 0,6 0,8 2 2, 7 3, 4 4, 1 4, 8 5, 5 6, 2 6, 9 7, 6 8, 3 9 9, 7 10 ,4 11 ,1 11 ,8 Nas gerações subsequentes a distribuição alterar-se-ia (no caso de autofecundação) mas manteria o carácter discreto, com os fenótipos distribuídos por somente 2 classes. 2ª situação: dois genes de acção cumulativa com dominância interalélica (e iguais valores extremos da característica). Teríamos então: 9/16 AB - 10m 3/16 Ab - 7m 3/16 aB - 7m 1/16 ab - 4m 0 0,1 0,2 0,3 0,4 0,5 0,6 2 2, 6 3, 2 3, 8 4, 4 5 5, 6 6, 2 6, 8 7, 4 8 8, 6 9, 2 9, 8 10 ,4 11 11 ,6 3ª situação: 3 genes de acção cumulativa e dominância interalélica 27/64 ABC - 10m 9/64 ABc - 8m 9/64 AbC - 8m 9/64 aBC - 8m 3/64 Abc - 6m 3/64 aBc - 6m 3/64 abC - 6m 1/64 abc - 4m 4 0 0,1 0,2 0,3 0,4 0,5 2 2, 7 3, 4 4, 1 4, 8 5, 5 6, 2 6, 9 7, 6 8, 3 9 9, 7 10 ,4 11 ,1 11 ,8 4ª situação - 4 genes de acção cumulativa e dominância interalélica 81/256 c/ 10m 108/256 c/ 8.5m 54/256 c/ 7m 18/256 c/ 5.5m 1/256 c/ 4m 0 0,1 0,2 0,3 0,4 0,5 2 2, 7 3, 4 4, 1 4, 8 5, 5 6, 2 6, 9 7, 6 8, 3 9 9, 7 10 ,4 11 ,1 11 ,8 Notar-se-á que, à medida que introduzíssemos na nossa hipótese maior número de genes, duas tendências se tornariam gradualmente mais evidentes: 1. o número de classes de alturas tenderia a aumentar e os intervalos a diminuir, isto é, a distribuição tenderia para a continuidade; 2. as distribuições seriam cada vez menos assimétricas, aproximando-se portanto da condição de normalidade. Reexaminemos de novo todas as situações hipotéticas acabadas de apresentar mas, agora supondo que não existe dominância interalélica, isto é, cada um dos alelos de cada gene dá um contributo próprio para a determinação do porte, independentemente da presença ou não do outro alelo do mesmo gene. 1ª situação: um gene 1/4 A1A1 - 10m 2/4 A1A2 - 7m 1/4 A2A2 - 4m 0 0,1 0,2 0,3 0,4 0,5 0,6 2 2, 7 3, 4 4, 1 4, 8 5, 5 6, 2 6, 9 7, 6 8, 3 9 9, 7 10 ,4 11 ,1 11 ,8 2ª situação: 2 genes 5 1 A1A1B1B1 10m 2 A1A1B1B2 8,5m 2 A1A2B1B1 8,5m 4 A1A2B1B2 7m 1 A1A1B2B2 7m 2 A1A2B2B2 5,5m 1 A2A2B1B1 7m 2 A1A2B1B1 5,5m 1 A2A2B2B2 4m 0 0,1 0,2 0,3 0,4 2 2, 7 3, 4 4, 1 4, 8 5, 5 6, 2 6, 9 7, 6 8, 3 9 9, 7 10 ,4 11 ,1 11 ,8 3ª situação: 3 genes 1/64 c/10m 6/64 c/9m 15/64 c/8m 20/64 c/7m 15/64 c/6m 6/64 c/5m 1/64 c/4m 0 0,1 0,2 0,3 0,4 2 2, 7 3, 4 4, 1 4, 8 5, 5 6, 2 6, 9 7, 6 8, 3 9 9, 7 10 ,4 11 ,1 11 ,8 4ª situação: 5 genes (com 4 daria números menos cómodos) 1/1024 indivíduos c/10m 10/1024 indivíduos c/9.4m 45/1024 indivíduos c/8.8m 120/1024 indivíduos c/8.2m 210/1024 indivíduos c/7.6m 252/1024 indivíduos c/7m 210/1024 indivíduos c/6.4m 120/1024 indivíduos c/5.8m 45/1024 indivíduos c/5.2m 10/1024 indivíduos c/4.6m 1/1024 indivíduos c/4m A representação gráfica da distribuição pode ver-se na figura 1. 6 Chegamos assim à importante conclusão de que a ausência dedominância, ou carácter aditivo do efeito dos alelos, determinou uma maior aproximação à simetria das distribuições de frequência das classes fenotípicas e aumentou o número destas classes (maior continuidade). Convém acrescentar que a todas as conclusões simples que vimos de estabelecer se poderia chegar também por via analítica, bastando para isso considerar que as distribuições da F2 são distribuições binomiais (no caso da dominância) ou polinomiais (no caso da aditividade) e que umas e outras tendem para a distribuição normal quando o número de genes aumenta. Resta agora referir ainda um factor que pode alterar significativamente o aspecto das distribuições anteriores: trata-se do efeito ambiental. Sabemos bem que o determinismo fenotípico não reside só nos genes mas também no ambiente, que pode modificar de forma mais ou menos profunda a expressão genotípica e, assim, diluir as fronteiras entre as classes da altura dos exemplos anteriores. Relativamente a esses exemplos, a admissão duma forte influência ambiental no determinismo do porte deveria ter as seguintes consequências: 1ª redução do leque de variabilidade atribuível aos genes, logo, uma maior proximidade das classes e maior continuidade; 2ª aparecimento de classes intermédias entre as teoricamente atribuíveis aos genes, com o mesmo significado de aproximação à continuidade. Estes efeitos podem ver-se na figura 1. 0 0,05 0,1 0,15 0,2 0,25 0,3 2 2, 6 3, 2 3, 8 4, 4 5 5, 6 6, 2 6, 8 7, 4 8 8, 6 9, 2 9, 8 10 ,4 11 11 ,6 Figura 1 - Representação esquemática da distribuição de uma característica quando governada por 5 genes aditivos (barras) ou pelos mesmos mais pelo ambiente (curva). Em resumo, poderemos dizer que o carácter contínuo das distribuições (por oposição a carácter discreto) é favorecido por elevado número de genes, fraca expressão dos mesmos (pequeno intervalo de variação e proximidade das classes), ausência de dominância ou efeito aditivo, grande influência ambiental. E o carácter normal é favorecido por grande número de genes, efeito aditivo e também pela forte influência ambiental. As influências do ambiente e da dominância sobre o tipo de distribuição estão bem expressas na figura 2, onde a "heritabilidade" pode ser, de momento, simplificadamente tomada como inverso da influência ambiental. 7 Figura 2 - Distribuições teóricas em F2. O modelo admite: (1) herança monogénica; (2) uma diferença de 12 unidades entre os pais; (3) que o efeito do ambiente varia desde nenhum (herdabilidade de 100%) até ao nível em que os factores ambientais são responsáveis por 3/4 da variabilidade total (herdabilidade de 25%). A coluna da esquerda representa ausência de dominância e a da direita dominância completa. Note-se que a escala usada para A difere da usada para B a E. (Adaptado de ALLARD , R.W. (1971) - Princípios do melhoramento genético das plantas. Edgar Blucher, S. Paulo). As características que em populações segregantes exibem distribuições contínuas - como a altura dos exemplos anteriores, quando governadas por muitos genes - designam-se características métricas ou biométricas ou quantitativas, por oposição a características que exibem distribuições discretas - como asas normais versus asas vestigiais em Drosophila - que se designam por características qualitativas. Os genes que governam as características qualitativas designam-se habitualmente por macrogenes ou genes maiores e os relativos às características quantitativas microgenes, genes menores, poligenes, sistemas poligénicos (relativo a um grupo de genes menores). Uma zona de fronteira, contudo de contornos mal definidos, entre as características qualitativas e as quantitativas é a das características quasi quantitativas, governadas por sistemas oligogénicos, com um número de genes relativamente baixo e frequentemente determinável com base na análise de variabilidade em populações segregantes1. 1 ALLARD , R.W. (1971) - Princípios do melhoramento genético das plantas. Edgar Blucher, S. Paulo. 8 3. ANÁLISE DA VARIABILIDADE DAS CARACTERÍSTICAS QUANTITATIVAS 3.1. Desvio ambiental No âmbito da genética qualitativa trabalhamos frequentemente com a noção de fenótipo, sinónimo de expressão observável (mesmo que não à vista) dum genótipo, face a determinado ambiente. Exemplos: gostador/não gostador PTC; sementes rugosas/lisas em ervilheira; sangue tipos A/B/O no homem. Mas essa terminologia é dificilmente aplicável à genética quantitativa, pois as características não assumem estados alternativos estanques, distribuem-se antes ao longo duma escala de valor. Por exemplo, a linguagem plantas altas versus plantas anãs deverá ser substituída por frequência de plantas com valor (altura) [1.5,1.6], [1.6,1.7], [1.7,1.8]... A noção de fenótipo deve pois ser adaptada à genética quantitativa como valor fenotípico, ou seja, valor expresso em unidades dum sistema de medida (gramas, metros, dias,...). O valor fenotípico dum indivíduo (ou duma população) é então um parâmetro que nós podemos avaliar directamente sobre esse indivíduo (ou população) (medindo, pesando...). Mas, a simples determinação do valor fenotípico de pouco serve, no sentido de caracterizarmos a variabilidade duma população e de intervirmos sobre a sua evolução ou, mais precisamente, de realizarmos a selecção, que é o objectivo último da nossa abordagem deste problema. Na área da genética qualitativa o fenótipo é um indicador mais preciso do respectivo genótipo, nós podemos "ver" este último através de instrumentos de análise genética relativamente simples e, assim, caracterizar a variabilidade das populações e orientar a sua evolução no sentido do nosso interesse (realizar o melhoramento). Por exemplo, a cor da lã na ovelha é governada por um gene com 2 alelos (branco, dominante, e preto, recessivo). Para seleccionar a favor da cor branca, escolheríamos em cada geração somente reprodutores brancos (eventualmente, com base em testes de descendência, para identificar os homozigóticos). Eventualmente, certas influências ambientais poderiam provocar o aparecimento de variações da intensidade da cor branca, porém, não o bastante para as aproximar do preto nem para provocar confusões de identificação dos genótipos pretendidos. E se a cor fosse governada por 50 genes, variando continuamente do preto ao branco? Ou, para nos mantermos mais próximos duma situação real, se se tratasse da produção numa população de clones de videira (também governada por 50 genes)? Então, neste caso, nós já não poderíamos observar directamente a relação entre cada genótipo e cada fenótipo. Para fazer a selecção teríamos de avaliar o rendimento dos elementos da população, dispô-los por ordem decrescente do respectivo valor e eleger os situados acima de determinado limite, por exemplo os clones 1 a 15 da figura 3, (colunas 4, 5 e 6). Ao fazermos isto, esperaríamos que os referidos melhores elementos, segundo o critério fenotípico, o seriam também sob o critério genotípico e que a sua superioridade seria transmitida à descendência. Na verdade, na prática, isto jamais acontece por inteiro: as determinações fenotípicas traduzem o efeito combinado do valor genotípico e dum desvio ambiental (P=G+E), por isso, os escalonamentos genotípico e fenotípico não são coincidentes. Nestas condições a primeira atitude experimental necessária para melhorar a eficácia da selecção consiste em reduzir ao mínimo as influências ambientais que rodeiam as determinações do valor. Mais precisamente, trata-se de decompor o valor fenotípico duma população em diversas componentes, recorrendo a modelos genéticos e estatísticos adequados, de modoa isolar a parte (ou partes) com maior significado, do ponto de vista da transmissibilidade às descendências, e reduzir a parte não transmissível. Neste sentido, a 1ª divisão do valor fenotípico que podemos fazer é obviamente, em componentes atribuíveis ao ambiente e ao genótipo: P=G+E. Esta decomposição consegue-se instalando as populações segundo modelos de ensaio adequados e fazendo as análises de variância correspondentes. 9 Para a redução dos desvios ambientais é importante instalar e gerir os materiais experimentais (populações a submeter a selecção) em obediência às regras clássicas do delineamento experimental. De forma simplificada há que seguir as seguintes regras: 1. Instalar as populações experimentais sob ambiente homogéneo. A expressão ambiente deve entender-se num sentido lato, abrangendo tudo quanto não é determinismo genético, nomeadamente, solo, clima e processo cultural. A importância da homogeneidade do solo pode ser exemplificada a partir da figura 3, donde constam as produções (kg/cepa) de 40 clones de Arinto num campo experimental com 8 repetições (blocos). Os valores genotípicos dos 40 clones em todos os blocos são os mesmos, porém, a dispersão dos valores fenotípicos no bloco 6 é muito superior à do bloco 3 (variâncias 0,786 e 0,310, respectivamente, para médias aproximadamente iguais). Portanto, o bloco 6 é mais heterogéneo do ponto de vista ambiental e proporcionará avaliações dos elementos fracamente correspondentes aos seus valores genotípicos. Duma maneira geral, a homogeneidade de solo é favorecida por tamanho moderado e forma quadrada dos blocos, inclinação homogénea e reduzida, ausência de linhas de água e de cumeada. A homogeneidade climática é prejudicada por variações de cota e de exposição. Um processo cultural homogéneo passa pela uniformidade de porta-enxerto, de mobilização de solo anterior à cultura e das técnicas de plantação, protecção sanitária, mobilizações, rega, etc.. 2. Usar representações grandes dos elementos das populações experimentais (por exemplo, 10, 15 ou 20 cepas por cada clone de videira numa população de clones, em vez de uma só cepa). Na figura 3 pode notar-se também que a variância dos rendimentos médios (das médias de 8x7=56 cepas) é inferior (0,1) à variância dos rendimentos em cada bloco (rendimentos médios de 7 cepas, valores de 0,25 a 1,124). O fundamento desta constatação decorre do teorema do limite central (Chase & Bown, pag 303 e Sokal & Rolph, pag 132). A necessidade de usar representações grandes decorre também directamente do modêlo do valor fenotípico, P=G+E. Este modêlo supões que cada planta é afectada por um desvio E, de média nula e variância diferente de zero, por isso, a existência de vários desvios por elemento contribui para que o desvio médio tenda para zero com o aumento do número. 3. Subdividir o conjunto de indivíduos representante de cada elemento da população em repetições (por ex: 20 indivíduos de 1 genótipo em 4 grupos de 5) e casualizá-las no espaço do ensaio. Desta forma controla-se melhor a variabilidade do terreno, do clima e do processo cultural. Vejamos um exemplo. Na figura 4A está representada uma população de 3 clones (grupos de 9 plantas) que se pretendem avaliar fenotipicamente. Porém essa avaliação será distorcida pelas influências ambientais diferenciais ao nível de cada um dos talhões em que se implantaram os clones. Por outro lado, a magnitude desta distorção é-nos inteiramente desconhecida. Mas, se dispusermos os clones no terreno segundo a figura 4B (9 repetições de uma planta por cada clone, com casualização global), conseguiremos reduzir os desvios ambientais e quantificar a parte remanescente (por comparação da variabilidade dentro dos clones com a variabilidade entre os mesmos). No exemplo concreto da figura 3 (40 clones de videira com 56 cepas cada, em 8 repetições) pode ver-se o seguinte: (1) a distribuição das médias é mais apertada do que a de qualquer das repetições, o que significa que a variação ambiental foi parcialmente reduzida com as repetições, o escalonamento das médias aproximou-se do escalonamento genotípico; (2) manteve-se um certo nível de variação ambiental, mas que foi possível quantificar (quadrado médio do erro, no quadro do fundo). 4. Casualizar as repetições. Face ao modêlo teórico P=G+E, as repetições e a casualização asseguram que os desvios E sejam casuais, respeitando-se assim um dos pressuposto de base do modêlo. 10 ARINTO Bucelas (3ª Fase) -1991 Análise baseada em todas as 8 Repetições Clo Ord Med.G. ord Clones Méd.G. Rendimentos das várias repetições ----- --- ------ ---- ------ ------ I II III IV V VI VII VIII Variância 0230 35 1.413 1 7503 2,284 2,196 1,669 2,792 2,029 2,458 2,335 1,895 2,9 0,1818 0310 10 2.078 2 7301 2,272 1,696 1,713 2,175 1,175 6,017 1,263 0,619 3,519 3,0268 0322 3 2.207 3 o322 2,207 1,169 3,825 2,355 1,946 1,596 2,165 2,725 1,875 0,6484 0344 37 1.382 4 8808 2,199 1,963 2,758 2,242 0,815 2,342 2,75 1,963 2,758 0,4254 0414 27 1.531 5 3605 2,187 2,135 2,89 1,915 1,419 2,49 3,06 1,435 2,155 0,3687 0498 33 1.43 6 7207 2,186 2,295 1,135 2,021 2,035 1,646 3,488 1,258 3,608 0,8624 0664 11 1.999 7 1501 2,171 1,596 3,388 1,645 0,779 3,194 1,929 1,413 3,425 1,0397 1501 7 2.171 8 8801 2,157 2,908 1,992 1,813 0,575 3,192 1,894 1,355 3,525 0,9810 2041 40 1.238 9 3601 2,156 2,079 3,125 1,546 1,269 2,835 2,792 0,913 2,69 0,6856 2404 21 1.594 10 o310 2,078 2,129 2,275 1,846 1,271 2,93 1,555 1,546 3,075 0,4318 2410 29 1.486 11 o664 1,999 1,895 2,258 0,515 1,175 3,858 0,875 2,858 2,558 1,2470 2423 24 1.575 12 3404 1,908 2,255 3,792 2,229 1,595 1,835 0,369 0,588 2,6 1,2094 2425 30 1.47 13 7507 1,9 1,669 1,346 1,888 2,169 1,563 3,069 1,363 2,135 0,3224 3012 22 1.579 14 8201 1,84 1,379 1,644 1,229 1,644 2,758 0,944 2,508 2,615 0,4793 3201 18 1.681 15 8007 1,825 1,725 1,335 1,119 1,115 2,719 3,44 0,975 2,175 0,7864 3203 36 1.408 16 7904 1,792 1,875 1,235 0,935 0,713 4,425 1,592 0,658 2,9 1,6717 3401 20 1.622 17 6611 1,71 1,229 2,458 1,313 1,775 1,955 1,515 1,419 2,015 0,1755 3404 12 1.908 18 3201 1,681 1,915 1,488 1,088 1,571 1,079 3,119 0,329 2,855 0,8703 3502 25 1.556 19 8308 1,674 0,394 1,235 1,246 1,455 2,59 2,246 0,869 3,36 0,9599 3503 38 1.345 20 3401 1,622 2,046 1,719 1,215 1,444 1,795 1,595 0,846 2,319 0,2150 3601 9 2.156 21 2404 1,594 0,735 1,055 1,175 2,385 2,925 1,592 0,625 2,263 0,7125 3605 5 2.187 22 3012 1,579 2,294 2,046 1,355 0,938 1,492 0,375 2,138 1,992 0,4472 3702 39 1.303 23 6007 1,577 2,046 1,544 1,463 1,255 1,869 0,555 1,755 2,125 0,2571 6007 23 1.577 24 2423 1,575 1,21 2,17 0,813 1,015 1,555 2,285 1,475 2,079 0,3071 6611 17 1.71 25 3502 1,556 2,81 1,213 1,515 0,729 2,358 1,129 0,879 1,813 0,5322 7016 32 1.432 26 9005 1,546 0,796 2,82 2,45 1,095 1,275 0,788 0,729 2,415 0,7538 7050 31 1.448 27 o414 1,531 1,694 1,963 1,421 0,935 1,679 0 1,138 3,417 0,9511 7207 6 2.186 28 8204 1,525 0,235 1,795 1,146 0,946 1,646 1,981 2,519 1,929 0,5128 7301 2 2.272 29 2410 1,486 1,815 3,158 2,363 0,555 0,996 0,775 1,013 1,215 0,7975 7502 34 1.423 30 2425 1,47 0,715 2,025 1,029 2,044 1,863 1,575 0,613 1,896 0,3548 7503 1 2.284 31 7050 1,448 1,796 2,419 0,944 0,896 1,929 0,806 1,329 1,463 0,3258 7507 13 1.9 32 7016 1,432 1,844 1,213 1,615 1,519 0,829 1,429 0,929 2,075 0,1841 7904 16 1.792 33 o498 1,43 1,279 2,006 1,663 0,855 0,269 1,544 2,081 1,746 0,3749 8007 15 1.825 34 7502 1,423 1,246 2,275 2,163 0,788 0,296 1,235 0,329 3,05 0,9796 8201 14 1.84 35 o230 1,413 2,215 1,592 0,475 0,913 1,925 0,688 0,719 2,775 0,7042 8204 28 1.525 36 3203 1,408 0,613 2,015 1,463 1,569 1,419 0,956 0,9252,308 0,3253 8308 19 1.674 37 o344 1,382 0,495 2,115 1,154 0,713 1,829 0,844 1,925 1,979 0,4234 8801 8 2.157 38 3503 1,345 1,315 0 1,596 1,779 1,546 1,208 2,219 1,096 0,4209 8808 4 2.199 39 3702 1,303 0,794 1,635 1,438 0,644 1,815 1,135 1,254 1,713 0,1832 9005 26 1.546 40 2041 1,238 1,975 1,292 0,554 0,394 2,056 1,525 0,975 1,135 0,3654 Médias 1,7277 1,6118 1,9908 1,5231 1,2484 2,1212 1,6105 1,3276 2,3887 0,6625 Variâncias 0,101 0,420 0,625 0,310 0,256 1,124 0,786 0,442 0,451 ↑ Variância Fenotípica (Clones+Ambiente) = δ²P 8 δ²E Origem var. G.L. S.Q Q.M. 0,0828185 Total 319 216 δ²E Clones 39 31 0,8067 δ²P h²= 0,18 0,0179956 Blocos 7 44 δ²G Erro 273 140 0,5155 δ²E h²= 0,361 Figura 3 - Arinto Bucelas 91, rendimentos e análise de variância 11 � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � ���� � � � � � � � � clone 1 clone 2 clone 3 (A) (B) Figura 4 - Três clones de videira representados por 9 plantas, sem repetições (A) e com 9 repetições de 1 planta (B). 3.2. Desvio de dominância. Efeito médio e valor reprodutivo O que vimos dizendo é válido para populações de elementos cujos genótipos passam íntegros entre ciclos sucessivos de selecção (da sub-população seleccionada para a sua descendência) como as populações de clones de videira e populações de clones em geral. O mesmo acontece no caso duma população de linhas puras duma espécie de autofecundação pois, neste caso, embora exista separação de genótipos em gâmetas, seguida de reconstrução de zigotos (através do processo sexual), os genótipos mantêm-se sempre os mesmos. Porém, se se tratar de populações de elementos de fecundação cruzada, surge uma complicação adicional, pois os genótipos separam-se em alelos e estes reagrupam-se em novos genótipos de geração em geração. Para vermos melhor, tomemos um exemplo esquemático: − − − ⇒ − − − = Taa TAa TAA haTaa haTAa haTAA Apc partidade população 3%64 5%32 5%4 /3 /5 /5 2.0)(/ Suponhamos que pretendíamos seleccionar a favor dos genótipos de 5T/ha e que estes eram fenotipicamente identificáveis (como consequência dum bom controlo da variabilidade ambiental) sub-pop. seleccionada 4AA : 32 Aa gâmetas 4/36A 16/36A 16/36a população descendente 25/81AA 40/81Aa 16/81aa Ora, a média da população descendente é 65/81x5T + 16/81x3T = 4 605kg. Tivemos a esperança de seleccionar uma sub-população superior geradora de 5000kg/ha e só obtivemos 4605kg/ha. Isto acontece porque, mesmo tendo suposto que controlámos completamente a variabilidade ambiental, nós não avaliámos os elementos por aquilo que efectivamente se transmite à descendência. O que avaliámos foram genótipos e o que se transmite são os alelos. É certo que os genótipos são compostos de alelos, porém, exibem frequentemente relações de dominância/recessividade que contribuem para o valor genotípico mas que não transitam para as descendências. Temos portanto que tentar decompor o valor genotípico em partes que tenham em conta os próprios alelos e o grau de independência (interalélica) com que eles contribuem para o valor. Então, precisamos de introduzir uma nova noção de valor associada aos alelos, que possibilite uma ordenação dos elementos da população por aquilo que verdadeiramente se transmite, e também descobrir a natureza da discrepância 12 entre os anteriores e o novo valor.Essa noção de valor vai ser o efeito médio dum alelo: desvio médio, em relação à média da população, dos indivíduos cujo genótipo contém esse alelo Para se entender melhor a natureza e quantificar o efeito médio em relação a outros valores, precisamos de o exprimir matematicamente e, para isso, vai ser-nos útil introduzir o seguinte modelo do valor genotípico: À escala dos valores foi subtraída a respectiva média, de modo que o centro seja zero, o que torna mais fácil a utilização do modelo. Vejamos um exemplo concreto. Suponhamos que aa = 1,2 (rendimento de 1 planta com o genótipo aa) Aa = 1,6 AA = 1,8 Subtraindo a média (1,5) a todos os valores, teremos aa = -0,3 (-a) Aa = 0,1 (d) AA = 0,3 (+a). A partir deste modelo podemos estabelecer uma expressão do valor genotípico médio duma população em que existam todos aqueles genótipos, em proporções definidas pela lei de Hardy-Weinberg ( em função de a,d,p,q) genótipos frequência valor genotípico valor X frequência A1A1 p2 a p2a A1A2 2pq d 2pqd A2A2 q2 -a -q2a Total (média da população), M = a(p-q)+2pqd Se a característica em causa for governada por vários genes de efeito cumulativo (que somam os seus efeitos, não apresentam epistasia), então a expressão pode generalizar-se M = ∑∑∑∑ a (p-q) + 2 ∑∑∑∑ pqd Uma observação importante a fazer desde já é que a média (valor genotípico médio) é decomponível em 2 partes: uma devida aos genótipos homozigóticos e outra aos heterozigóticos (uma não tem d e outra tem) e que esta será diferente de zero, se houver dominância, e igual a zero, se não houver dominância. Isto sugere-nos desde já que uma possível Aa AA aa 0 +a d -a genótipos valores genotípicos 13 "divisão natural" do valor genotípico será entre o que é devido à dominância e o que não é. E já vimos mais atrás que o valor devido à dominância não é transmitido à descendência... Retomemos agora a definição de efeito médio, no sentido de o exprimir face ao modelo do valor genotípico. A1A2 A1A2 A1A1 A1A2 A1A1 . . A1A1 A1A2 A2A2 A2A1 A1A2 . . Genótipos formados por A1 fixo e outros alelos ao acaso da população ⇒ M(A1) Todos os genótipos da população ⇒ M(pop) Então, efeito médio de A1 = M(A1) - M(pop.). Podemos agora concretizar melhor, expressando o efeito médio em função de a, d, q, do modelo dos valores genotípicos Alelos Frequência dos genótipos c/ A1 fixo, mais A1 ou A2 aleatórios Valores genotípicos Média dos genótipos com A1 Média da população (já visto atrás) A1 A1 fixo A1 aleat. → p a p a A1 fixo A2 aleat. → q d q d = pa+qd a(p-q)+2pqd A2 raciocínios idênticos aos relativos a A1 = pd-qa Então, efeito médio de A1 � α1 = pa + qd - [a (p-q) + 2pqd)] = = q [a + d (q-p)]1 efeito médio de A2 � α2 = -p [a + d (q-p)] A noção de efeito médio de um alelo está estreitamente relacionada com a noção de efeito médio de substituição de um alelo (pelo outro do mesmo gene), que também nos pode ser útil: e.m. de substituição de A2 por A1 é o desvio médio ao trocarmos ao acaso A2 por A1, nos genótipos da população. É também igual à diferença entre os efeitos médios de A1 e de A2, como pode ver-se 1 Pa+qd-pa+qa-2pqd qa+qd-2pqd = qa+qd(1-2p) = qa+qd(1-p-p) = qa+qd(q-p) = q[a+d(q-p)] 14 genótipos com A2 genótipos com A1 genótipos população A2A1 A2A2 A2A2 A2A1 A2A2 . . Trocando A2 por A1 � A1A1 A1A2 A1A2 A1A1 A1A2 . . A1A2 A1A1 A1A2 A2A2 A2A1 . . M(A2) � M(A1) M(pop) segundo a definição, e.m. substituição A2/A1 (α) = M(A1)-M(A2) =[M(A1)-M(pop)] - [M(A2)-M(pop)] � � e.m. A1 (α1) e.m. A2 (α2) Então, α (A2/A1)= α1-α2 Podemos notar ainda que ao fazer as trocas A2 por A1 (no esquema acima), uma proporção q foi em genótipos A2A2 (com A2 fixo, mais outro A2, existem q genótipos) e uma proporção p em genótipos A1A2, e as consequentes mudanças de valor foram (a-d) e (d+a), respectivamente genótipo original Troca Freq. Diferença de valor Freq.XDiferença A1A2 � A1A1 p a-d → p(a-d) A2A2 � A1A2 q d-(-a)=d+a → q(d+a) Portanto, α (A2/A1) = p(a-d)+q(d+a) = a+d(q-p). Retomando os valores de α1 e α2 calculados atrás, α1= q[a+d(q-p)] e α2= -p[a+d(q-p)], chegamos também à relação já acima estabelecida, α (A2/A1)=α1-α2, A1A2 A1A1 A2A2 0 +a d -a genótipos valores genotípicos 15 e ainda, α1=qα e α2=-pα. Depois destas deduções relativas ao efeito médio (o que se transmite) podemos tirar já uma conclusão importante: o e.m. (dum alelo numa população) depende dos valores genotípicos e das frequências génicas, i.e., um alelo não vale só em si mesmo, mas também em função da frequência com que aparece na população. Exemplo: para o caso do modelo o efeito médio de A1 é maior se houver muitos A2 (q elevado) porque então a média de todos os genótipos afasta-se muito da dos que têm A1 (ver mais atrás quadro relativo à dedução de expressão do efeito médio). Introduzimos, portanto, uma noção de muito interesse - o efeito médio dum gene numa população - que é aquilo que pensamos que efectivamente se transmite de geração em geração. Se o somatório dos efeitos médios dos genes que governam uma característica numa população (ao nível dos seus diferentes elementos) fosse determinável, então o problema da selecção estaria quase resolvido: bastaria ordenar os elementos da população pelo somatório dos efeitos médios e seleccionar os melhores. Porém, o efeito médio dos genes não se pode medir directamente. Podemos avaliar fenótipos (indivíduos), mas não alelos (gâmetas). Temos então que introduzir um novo conceito de valor que seja mensurável em termos fenotípicos e que tenha uma qualquer relação matemática com o efeito médio, de modo que possamos conhecer indirectamente este por via daquele. Esse parâmetro é o valor reprodutivo, que podemos definir do seguinte modo: valor reprodutivo dum indivíduo (genótipo) numa população é o dobro do desvio médio da sua descendência, quando se cruza ao acaso com todos os indivíduos da população, em relação à média da população. Em linguagem matemática, e relativamente ao nosso modelo do valor genotípico, teremos genótipo cruza ao acaso com � frequência do cruzamento frequência da descendência valor genotípico valor médio da descendência A1A1 A1A1 A1A2 A2A2 p2 2pq q2 p2A1A1 pqA1A1 pqA1A2 q2A1A2 p2a pqa pqd q2d a(p-q)+2pqd A1A2 A1A1 A2A2 0 +10 5 -10 genótipos valores genotípicos 16 valor reprodutivo A1A1 =2 [p2a+pqa+pqd+q2d-(a(p-q)+2pqd)] =2 q[a+d(q-p)] 1 Ora q[a+d(q-p)] é o efeito médio de A1(α1), como já visto mais atrás. Podemos então escrever, valor reprodutivo A1A1 = αααα1+αααα1 Por meio de raciocínios idênticos poderíamos também estabelecer: valor reprodutivo A2A2 = αααα2+αααα2, e valor reprodutivo A1A2 = αααα1+αααα2 o que nos permite dar uma nova definição de valor reprodutivo: valor reprodutivo dum genótipo é a soma dos efeitos médios dos seus alelos. Definimos pois a noção de efeito médio dos alelos como sendo a parte do valor genotípo que se transmite à descendência � uma parte transmite-se α1+α1=q(a+d(q-p))x2 � outra parte não se transmite (a diferença) Depois definimos e expressámos, em relação ao modelo, a noção de valor reprodutivo, v.r. A1A1 = αααα1+αααα1, ou seja, a parte do valor genotípico que se transmite. Acentuámos ainda que o interesse deste parâmetro é que ele é determinável, pois corresponde a um desvio médio fenotípico entre as descendências de cruzamentos e a média geral (ver definição). Resta-nos agora ver melhor o que é a parte remanescente não transmissível: 1 2[(1-q)2a+(1-q)a + pqd+q2d-(1-q)a+qa-2pqd] = 2[a+q2a-2qa+qa-q2a-a+qa+qa+pqd+q2d-2pqd+q2d-2pqd] = 2[qa+qd(q-p)] = 2q[a+d(q-p)] genótipo A1A1 com valor genotípico a-[a+d(q-p)] 17 Média da população (deduzida mais atrás) → a(p-q)+2pqd Efeito médio de A1 → α1=q[a+d(q-p)] Genótipos Frequências Valores genotípicos A1A1 p2 +a A1A2 2pq d A2A2 q2 -a Valor genotípico em termos de desvio da média 1 a-[a(p-q)+2pqd] = = 2q(a-pd) ou 2q(α-qd) a(q-p)+d(1-2pq) ou (q-p)α+2pqd 2p(a+qd) ou -2p(α+pd) Valor reprodutivo 2q[a+d(q-p)] ou 2qα (q-p)[a+d(q-p)] ou (q-p)α -2p[a+d(q-p)] ou -2pα Desvio dominante (diferença entre os valores anteriores) -2q2d 2 2pqd -2p2d 3 Verifica-se, portanto, que a diferença entre o valor genotípico e o valor reprodutivo depende só da dominância. Quando esta for nula o valor reprodutivo é igual ao valor genotípico. O valor reprodutivo depende dos efeitos aditivos do gene. Assim, podemos escrever P=A+D+E 3.3. Desvio de interacção As deduções anteriores são válidas para um gene ou para vários genes com efeitos cumulativos (sem epistase) (pag.?). Havendo relações espistáticas entre alguns dos genes envolvidos no controlo da característica, surge um outro desvio como componente do valor genotípico, desvio de interacção ou epistático, G=A+D+I e então a expressão do valor fenotípico vem, P=A+D+I+E. O cálculo do desvio de interacção é normalmente difícil e não tem muito interesse em grande parte das situações práticas que se nos apresentam. 1 para ser comparável com o valor reprodutivo, que é também um desvio em relação à média. 2 a-[a(p-q)+2pqd]-2q[a+d(q-p)] = a-[pa-qa+2pqd]-2qa-2q2d+2pqd = a-pa+pa-2pqd-2qa-2q2d+2pqd= =a(1-p+q)-2qa-2q2d= -2q2d 3 -a-[a(p-q)+2pqd]+2p[a+d(q-p)] = -a-(pa-qa+2pqd)+2pa+2pqd-2p2d = -a-pa+qa-2pqd+2pa+2pqd-2p2d = =-a(+1+p-q)+2pa-2p2d = -a(2p)+2pa-2p2d = -2p2d 18 4. VARIÂNCIA DOS VALORES GENOTÍPICOS E REPRODUTIVOS. HERITABILIDADE. RESPOSTA À SELECÇÃO 4.1. Noção de heritabilidade Podemos sintetizar quanto dissemos até aqui detendo-nos no quadro seguinte: A escala P é aquela a que nós chegamos sempre, na prática do trabalho experimental. Mas pela utilização de técnicas especiais podemos despi-la mais ou menos de certos desvios, de forma que ela se aproxime razoavelmente do escalonamento genotípico ou do escalonamento aditivo (por simplificação é habitual então dizer-se que estamos a fazer determinação genotípica ou determinação do valor reprodutivo, respectivamente). No caso de populações de clones, o valor genotípico transmite-se às "descendentes": há que fazer avaliações fenotípicas próximas do valor genotípico (G=P-E). No caso dos elementos de fecundação cruzada, o que se transmite é o valor aditivo (A=P-D-E). Por isso, devemos fazer avaliações desse valor (aditivo ou reprodutivo), observando os mesmos cuidados de contrôlo da variação ambiental. Posto isto, dispomos dos instrumentos de análise para fazer uma selecção bastante eficaz, quer se trate de clones ou de elementos de fecundação cruzada. Todavia, poderemos ainda aprofundar a análise do problema, introduzindo instrumentos suplementares para determinaro grau de rigor das avaliações fenotípicas (grau de aproximação aos valores genotípicos ou aditivos) para prever quanto se vai ganhar (em relação a determinado carácter) ao aplicar as técnicas anteriores de avaliação e de selecção. Para isso, examinaremos o problema da selecção por um outro prisma (Fig 5). Se as determinações do valor para efeito de selecção (distribuição superior da figura 5, curva a) fossem exactamente as genotípicas ou aditivas, então a superioridade do conjunto seleccionado observar-se-ia também na descendência e a média desta (curva e) seria Ms. O resultado da selecção (ganho, ou resposta) seria pois R=S. Desde que as determinações fenotípicas comportam sempre desvios ambientais, então alguns dos elementos seleccionados, por estarem fenotipicamente à direita de L (curva a), estão genotipicamente (ou aditivamente) à esquerda desse limite e , por isso, vão arrastar também para a esquerda a média da descendência (média da curva d). Média A G=A+D P=A+D+E P=G+E 19 Então, a expressão do ganho terá que ser corrigida, de acordo com o nível de influências ambientais nas determinações fenotípicas dos elementos R=S*K (0≤K≤1) Logicamente, o factor K será o índice da importância relativa dessas influências ambientais. Para procurarmos o índice K, notemos (numa base empírica, observando a penúltima figura ) que quanto maiores forem os desvios ambientais maior será a discrepância entre os escalonamentos genotípico e o fenotípico, mais largo será o leque deste 2º em relação ao primeiro, portanto um índice de relação entre a abertura dos dois leques pode servir para K. Por outro lado, o teorema da aditividadade da variância e experiências de simulação em computador (a fazer nas aulas práticas) sustentam que ao somarmos 2 variáveis aleatórias (p. ex. valores genotípicos duma população e desvios ambientais) as respectivas variâncias também se somam, ou seja, se P=A+D+E, então, σ σ σ σP A D E 2 2 2 2 = + + . Rendimento (kg/ cepa) 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0 1 2 3 4 5 6 7 8 9 10 S Mg Ms L POPULAÇÃO EXPERIMENTAL (a) a b 20 Rendimento (kg/ cepa) 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0 1 2 3 4 5 6 7 8 9 10 R DESCENDÊNCIAS DA POP. EXPERIMENTAL(c) E DA SUB-POPULAÇÃO SELECCIONADA (d) c d e Figura 5 - Esquema das distribuições de frequência numa população a submeter a selecção (a), da correspondente distribuição genotípica (b), da sua descendência (c), da descendência do grupo seleccionado (d) e significado do diferencial (S) e do ganho de selecção (R). Isto significa que a variância fenotípica é divisível em componentes aditiva, dominante e ambiental, ou genotípica e ambiental, e que a relação entre as 1ª e a última exprime a discrepância dos respectivos leques de variação e corresponde a K. Esta relação designa-se por heritabilidade, h A A P ( ) 2 2 2= σ σ heritabilidade aditiva ou em sentido restrito, h G G P ( ) 2 2 2= σ σ heritabilidade genotípica ou em sentido lato. A heritabilidade duma característica na população depende de todas as componentes da variância. Portanto, uma qualquer mudança em qualquer destas afectará o seu valor. Por exemplo, para uma mesma população, um ambiente pouco homogéneo determina uma componente variância ambiental elevada e uma h2 mais baixa. Por outro lado, uma população sujeita a intensa selecção durante várias gerações tenderá para a fixação de vários genes, com redução de variabilidade genética, e a h2 baixará também. Este último aspecto pode parecer à primeira vista algo paradoxal. Porém, repare-se que no caso extremo duma população pura, a selecção de certo número de indivíduos com melhor fenótipo é completamente ineficiente, isto precisamente porque não há variância genética, a h2 é zero. Outro exemplo: dispomos de 2 populações de 7 clones de videira (7 genótipos, os mesmos em ambas), na 1ª cada um representado por 10 cepas em 5 repetições e na 2ª por 2 cepas (dispostas lado a lado). 21 A determinação do valor fenotípico (por exemplo do rendimento) fornecerá uma distribuição muito mais apertada no 1º caso do que no 2º, isto é, o delineamento experimental (repetições, casualização, maior nº de indivíduos por unidade experimental) permite reduzir os desvios ambientais e aproximar o valor fenotípico do valor genotípico. Isto mesmo se pode ver também na figura 3, notando que, em princípio, a variância fenotípica da média é tanto menor - logo, a h2 tanto maior - quanto maior o número de repetições. Portanto, conclui-se que populações com os mesmos genótipos podem conduzir a estimativas da variância ambiental diferentes e a h2 diferentes, dependendo da maneira como são constituídos os elementos da população, como estão dispostos no terreno etc.. A heritabilidade não é simplesmente um parâmetro respeitante a uma característica mas sim a uma característica numa determinada população e em determinado ambiente. 4.2. Estimativa da heritabilidade Das variâncias que figuram nas expressões de h2 só a σP 2 é directamente calculável a partir dos valores fenotípicos dos elementos, as restantes terão de ser estimadas por métodos indirectos. Porém, uma pista quanto às boas possibilidade que se nos oferecem neste ponto pode ser visualizada desde já com o seguinte exemplo simples: se dispusermos duma população experimental de clones de videira enxertados numa área de 1 ha, uma estimativa de σE 2 (rendimento) pode ser obtida dispondo um clone numas ≈10-20 posições casualizadas no campo e determinando a variância das suas produções, pois essa variância nâo tem componente genotípica, é exclusivamente ambiental. Acontece pois que, embora os valores genotípico e aditivo não sejam directamente calculáveis, as respectivas variâncias podem sê-lo, por via indirecta. Existem numerosos métodos para a decomposição da variância fenotípica e cálculo de h2 aplicáveis às mais diversas situações e geralmente baseados em modelos estatísticos de análise mais ou menos complexos. Veremos seguidamente alguns métodos aplicáveis a situações específicas. 1º - Cálculo de h2 a partir de populações experimentais P1, P2, F1, F2 e Backcross Vamos retomar o modelo do valor genotípico já apresentado anteriormente, usando agora terminologia diferente para os valores (só para fins de familiarização) 11 77 33 44 66 22 77 11 77 33 22 7755 77 11 11 22 33 44 55 66 77 aa AA Aa -da (ou -d) ha (ou h) +da (ou +d) 0 genótipos valores genotípicos 22 Nestas condições, é possível deduzir expressões representativas da variância genética aditiva nas gerações descendentes do cruzamento AA x aa em função de d e h. Na F1 teremos, como é evidente: VG(F1)=0 Na F2, o valor genotípico médio será _____________________________________ Proporções ⇒ ¼aa ½Aa ¼AA Valor ⇒ -d h d _____________________________________ média=½h e a variância VG(F2) = ¼(d-½h) 2 + ¼(-d-½h)2 + ½(h-½h)2 = ½d 2 + ¼h 2 A variância (genética) da F2 é, portanto, desdobrável numa componente aditiva (½d2) e numa componente dominante (¼h2). Considerando agora o cruzamento retrógrado AaXaa, cuja descendência é ½AA: ½Aa, com os respectivos valores -d e h, temos que a média é ½(d+h) e a variância (processo de cálculo semelhante ao usado para a F2) VG(B1) = ¼(d+h)2 Igualmente, para o backcross Aa X AA se obtém,VG(B2) = ¼(d-h)2 Até aqui considerou-se que toda a variância era genética e que a característica era governada por um só gene. Mas os mesmos raciocínios são também generalizáveis aos casos em que as características são de controlo poligénico e em que exista uma componente ambiental da variância (mas não interacção). Tomando então D=∑d e H=∑h, podemos escrever, VP(F2)=1/2 D 2+1/4 H2+E, VP(B1)=1/4 (D+H)2+E, VP(B2)=1/4 (D-H)2+E. 23 Nestas duas últimas expressões não são separáveis (como no caso da F2) as componentes aditiva e dominante da variância, mas a dificuldade pode ultrapassar-se efectuando a soma VP(B1)+VP(B2)=1/2 D2+1/2 H2+2E. Notemos agora que a variância aditiva da F2 se pode exprimir nas variâncias totais das F2 e B.C., da seguinte forma, 2VP(F2) - [VP(B1) + VP(B2)] = 2(1/2 D2 + 1/4 H2 + E) - 1/2 D2-1/2 H2-2E = = 1/2D2 = VA(F2). E finalmente, h2= 2VP(F2) - [VP(B1)+VP(B2)] / VP(F2) Exemplo de aplicação (R. Allard 1, p. 85) Foram determinadas as datas de floração de 2 linhas de trigo Ramona (P1) e Baart (P2) e das suas F1, F2, BC1, e BC2, medindo-se a data da antese em dias, a contar duma origem temporal arbitrária, nº de dias para floração a partir de origem arbitrária Gerações 4-6 7-9 10-12 13-15 16-18 19-21 22-24 25-27 28-30 31-33 34-36 37-39 40-42 n x s2 P1 4 21 60 48 20 4 2 159 12,99 11.036 P2 33 56 35 19 5 148 27,61 10,32 F1 1 2 20 83 51 12 2 171 18,45 5,237 F2 4 25 66 156 115 50 41 38 34 16 4 3 552 21,2 40,35 B1 1 12 88 77 85 50 6 4 1 1 1 326 15,63 17,352 B2 4 34 49 47 45 61 41 26 6 1 314 23,38 34,288 Introduzindo os valores do quadro na fórmula de h2 deduzida atrás, temos 72035040 3521728834354022 , , ,,,xh =−−= A componente ambiental da variância não pode ser determinada directamente (está confundida com a componente de dominância). Podemos, porém, tomar como boa estimativa dessa componente a média das variâncias das gerações P1, P2 e F1, pois são famílias geneticamente homogéneas (sem variância genotípica), 1 ALLARD , R.W. (1971) - Princípios do melhoramento genético das plantas. Edgar Blucher, S. Paulo 24 VE = (11,036 + 5,237 + 10,320) / 3 = 8,864. A componente dominante da variância pode calcular-se por diferença para o total VDom= 40,35 - 8,864 - 29,06 = 2,426 Exemplo 2 (Lacadena1, p. 198) Observações sobre casos de pigmentação humana conduziram aos seguintes resultados nº observações variância Branco 105 0,00109 Negro 106 0,00105 Branco x Negro (F1) 94 0,00159 F1 x Negro (B1) 26 0,00171 F1 x Branco (B2) 30 0,0020 F2 14 0,00199 Por raciocínios semelhantes aos anteriores teremos, h2 = 2 x 0,00199 - (0,00171 + 0,002) / 0,00199 =0,14 VE = 0,00109 + 0,00105 + 0,00159 / 3 = 0,00124 V Dom = 0,00048 2º Cálculo a partir da estimativa de VE em população geneticamente uniforme Uma situação relativamente simples é aquela em que se dispõe duma população geneticamente homogénea (linha pura, clone ...) no mesmo ambiente da população a estudar. Determina-se então a variância ambiental da população uniforme e extrapola-se este valor para a população sob análise. Nesta, a variância genotípica será a diferença entre a variância total e a variância ambiental da população uniforme. Exemplo de J.-R. Lacadena, p. 197 População sob análise, VG + VE (=VP) = 0,366 População geneticamente uniforme e conduzida no mesmo meio, VE = 0,186, logo, VG = 0,180 e h2= 0,180/0,366=0,47. É claro que este método não permite distinguir as componentes de dominância (nem de interacção) pelo que a h2 que se calcula é a heritabilidade em sentido lato. 1 Lacadena, J.-R. (1976) - Genética (2ª ed.). AGESA, Madrid. 25 Há ainda outra precisão a fazer: a população sob estudo e a população genotipicamente homogénea devem ser conduzidas no mesmo ambiente (por exemplo, casualizando os seus elementos no mesmo espaço experimental ...) e os elementos devem ser iguais, por exemplo, se a população em estudo for um conjunto de 50 genótipos, cada um representado por 10 plantas (os valores fenotípicos são médias de 10 plantas), então a população homogénea deve ser uma população de grupos de 10 plantas do mesmo genótipo. Porém, existe uma relação matemática entre a variância de populações com os mesmos genótipos quando representados por número diferente de indivíduos, pelo que se pode dar a volta àquele problema por via de cálculo (veremos isso no exemplo seguinte) Exemplo (da selecção massal e clonal da videira em curso no Departamento). Dispõe-se duma população de 40 clones da casta Arinto, cada um representado por 56 cepas, e dos respectivos rendimentos em 8 repetições (grupos de 7 cepas) (fig. 3). A variância fenotípica da população é, evidentemente, a variância das médias gerais da 6ª coluna, σP 2 0 1= , Quanto à variância ambiental, que no exemplo anterior se calculou com base numa população genotipicamente homogénea destinada a esse efeito, determinou-se aqui a partir da própria população em estudo. Assim, a variância dos oito rendimentos observados nas 8 repetições dum clone dá uma estimativa da variância ambiental ao nível de grupos de 7 cepas. Dividindo este número por 8 (da estatística) obtemos a estimativa para unidades de 56 cepas (é como se tivéssemos a média de 56 cepas onde temos as produções médias de 7). Fazendo o mesmo para os 40 clones disponíveis, ficaremos a dispor de 40 estimativas da variância ambiental de grupos de 56 cepas. E a respectiva média será ainda uma melhor estimativa de σE 2 . Na figura 3 podemos observar esse valor (0,6625/8) σΕ 2 = 0,0828185 Nestas condições, teremos 38,0 1,0 0828185,01,0 2 22 2 2 2 = − = − == P EP P Gh σ σσ σ σ Neste mesmo caso, a h2 poder-se-ia calcular com base no modelo clássico de análise de variância correntemente usado em experimentação agronómica, Origem da variação G.L. S.Q. Q.M. Esperado Clones 39 31 0,806 σE2 + NσG2 (A) Blocos 7 44 Erro 273 140 0,515 σE2 (B) Total 319 216 26 O quadrado médio associado aos clones corresponde à variância fenotípica e o associado ao erro à variância ambiental. Então, h2 = (0,806 - 0,515)/0,806 = 0,361 Vimos 2 métodos de cálculo de h2 que, todavia, não são os mais usados na prática, pois referem-se a situações mais ou menos particulares. Muitas vezes pretende-se estudar populações que se reproduzem sexualmente (fecundação cruzada) e não são F2 (como no 1º método visto atrás). Então é necessário fazer ensaios de descendência para aproximação ao conhecimento do valor reprodutivo e determinação de σ 2 A . 3º Cálculo da h2(A) através da partição de variância VP = VA+VD+VE No último exemplo visto atrás (relativo à determinação de G 2h em populações de clones de videira) vimos que era possível fazer a decomposição VG=VP-VE com base em modelos de análise de variância apropriados. Desde que se tratava duma população de clones, os valores determinados eram valores genotípicos (com mais ou menos desvios ambientais, dependendo do dispositivo experimental). Se em vez duma população de clones, as determinações incidissem sobre famílias descendentes duma população de genótipos de fecundação cruzada (half-sibs ou descendências de meios irmãos), então estaríamos a determinar valores reprodutivos (com ± desvios ambientais) A=P-D-E e poderíamos assim determinar a (A) 2h (A)2 A P h V V = 4º Cálculo da h2A através da análise de semelhança entre parentes - regressão descendência/um progenitor Semelhança entre descendentes e progenitores - regressão descendência/progenitor médio - outros - correlação intra-classe de famílias half-sib Semelhança dentro de famílias descendentes - correlação intra-classe de famílias full-sib - outros Descendência e um progenitor Vejamos o quadro (tirado do quadro da pag. 19) 27 Genótipos Frequência Valor genotípico, como desvio para a média Valor genotípico da descendência, como desvio da média A1A1 p2 2q(α-qd) q α A1A2 2pq (q-p) α + 2pqd 1/2 (q-p) α A2A2 q2 -2p (α +pd) -p α Como os valores são desvios para a média, e o total é p2+2pq+q2=1, a covariância dos valores genotípicos da descendência e dos valores genotípicos da população inicial calcula-se como p2 . 2q (α - qd) q α + 2pq [(q-p) α + 2pqd] . 1/2 (q-p) α + q2 [-2p (α + pd)] (-pα) = pqα2 Logo, POCOV = pqα2 Calculemos agora a variância aditiva, ou dos valores reprodutivos, também a partir do quadro pag. 19, AV (2q )2 p2 (q p) 2 2pq ( 2p )2q2 4p2q2 2 2pq3 2 4p2q2 2 2p3q3 2 4p2q2 2 2pq 2(2pq q2 2pq p2 2pq 2pq 2 = + − + − = + − + + = = + − + + = = α α α α α α α α α α Verifica-se então que a covariância descendentes/progenitores (offsprings/parent, OP) é metade da variância aditiva APO VCov 2 1 = Por outro lado, a variância dos progenitores é a variância fenotípica, pelo que poderemos escrever 2 P A P OP h 2 1 V V 2 1 V COV == Mas b V COV P OP = (coeficiente de regressão), por isso, conclui-se também, 2bh 2 A = Verifica-se portanto que, com base num processo experimental clássico (análise de regressão), destinado ao estudo da releção entre variáveis, se pode chegar também à estimativa da heritabilidade. 28 Descendência e progenitor médio A covariância da média da descendência e da média dos 2 progenitores (ou progenitor médio) pode estabelecer-se com base em raciocínios semelhantes aos anteriores, embora um pouco mais laboriosos. Neste caso teríamos de organizar previamente um quadro com os diferentes cruzamentos possíveis (A1A1 x A1A1, A1A1 x A1A2, ..., 6 tipos), as suas frequências, os seus valores genotípicos médios e os das suas descendências e partir depois para o cálculo de CovOP , como no caso anterior. O resultado seria idêntico ao obtido para a CovOP, isto é Cov 2pq VOP 2 A= =α 12 Há que notar agora que a variância do progenitor médio é ½ da variância de um progenitor (lembrar relações entre variância de amostras), daí 2(A) P A P PO P PO h V 2 1 V 2 1 V 2 1 COV V COV === e b V COV P PO = logo, bh 2(A) = Half-sibs São os grupos descendentes de um progenitor, cruzado aleatoriamente com todos os elementos da população. A semelhança dentro dos half-sibs será maior do que a semelhança entre eles e essa relação de semelhanças pode ser medida pela correlação intra-classe t COV V HS P = A covariância pode ser tomada como o somatório dos produtos dos desvios de pares de elementos tomados ao acaso dentro dos grupos half-sib, mas corresponde também à própria variância das médias dos half-sib (da estatística). Esta, a partir dos quadros das pág. 30 e 19 (verificar), pode ser calculada como ( ) ( ) ( ) 2 2 1 2 2 12 2 4 12 22222 4 1222 pq qp pq pqpqpqpq pqpq*2pqqp ][ ][ α α α ααα = =+= =+−+= =+−+ 29 Ora, A4 12 2 1 Vpq =α (ver dedução de VA na secção anterior), pelo que COV V e t COV V V V h ou, h 4t HS 1 4 A HS P 1 4 A P 1 4 (A) 2 (A) 2 = = = = = É de notar que, supondo a população experimental (progenitores) em equilíbrio de Hardy-Weinberg, a população descendente, considerada como população de indivíduos (não população de famílias half sib), tem a mesma estrutura genética daquela. Por isso, VP pode ser calculada também na própria descendência, o que dispensa a realização de quaisquer determinações na população de progenitores. Isto pode ser importante quando, por qualquer razão, não se dispõe da possibilidade prática de realizar essas determinações (por exemplo, se a população progenitora for uma população estabelecida por enxertia, para repetir os genótipos e assegurar polinização casual entre eles, o que modifica o comportamento fisiológico das plantas e os valores fenotípicos de algumas características). Exemplo da selecção do pinheiro bravo Foi realizado o seguinte trabalho experimental: 1º Selecção fenotípica de indivíduos em vários povoamentos distribuídos pelas zonas de pinhal do país. 2º Enxertia dos mesmos numa população experimental, com várias repetições, para assegurar polinização casual e uma perfeita correspondência com o modelo decorrente da definição de valor reprodutivo. 3º Com semente dos genótipos da população anterior, instalação de um ensaio de descendência, segundo as regras do delineamento experimental, para determinar os valores genotípicos (aproximados) da característica sob análise. Estes valores são valores genotípicos relativamente às famílias do próprio ensaio e valores reprodutivos quanto aos genótipos iniciais da população de inter-polinização. Continua com problema 202 (verificar número) da colecção. 4.3. Resposta à selecção O problema da selecção está esquematizado em linhas gerais na pág. 20. Depois da ordenação dos elementos da população pelos valores fenotípicos com média M, é escolhida uma certa proporção dos que apresentam os melhores valores, de média Ms. Se o valor fenotípico correspondesse exactamente ao valor genotípico (no caso de clones, por exemplo) ou ao valor reprodutivo (no caso de reprodução sexual em geral), então poderíamos esperar que a descendência do grupo seleccionado tivesse uma distribuição do tipo da representado a traço leve na figura (em baixo, do lado direito), i.é., o ganho ou resposta seria igual à própria diferença das média Ms-M=S, chamada diferencial de selecção. Mas como, em geral, os valores fenotípicos não correspondem exactamente aos valores genotípicos ou valores reprodutivos, então esse ganho será inferior a S R = K*S com 0 ≤ k ≤ 1 30 Ora, uma medida do desajuste entre valores fenotípicos e valores genotípicos (ou reprodutivos) é precisamente h2, que ocupará então o lugar daquela constante de proporcionalidade. R = h2*S Esta expressão aparece mais frequentemente sob a forma R h S h i= =2 2 σ σ σ ou seja, com S expresso em número de desvios padrões i. A este valor i chama-se intensidade de selecção. Não deve confundir-se com proporção de elementos seleccionado, o seu valor depende dessa proporção mas não se confunde com ela: se se seleccionarem poucos elementos a diferença de médias S corresponde a muitos desvios padrões, se se seleccionarem poucos é o contrário. Com base em grandes conjuntos de experiências de selecção com determinadas classes de materiais constroem-se tabelas de valores de i para diversas proporções de selecção, outras vezes são apresentadas fórmulas empíricas. Uma muito usada é a seguinte: i = 0,8 + 0,41ln (1/p.s. - 1) p.s. - proporção de selecção A vantagem de trabalhar com R = h2 i σσσσ em vez de R = h2 S é que não temos de estar a calcular S para cada proporção de selecção que queiramos praticar (o que implicariamais cálculos). Por outro lado, usar i em vez de S corresponde a considerar a distribuição da população em estudo como normal, ignorando os desvio provocados por valores de alguns elementos mais discrepantes da população. Voltando à expressão R=h2 i σσσσ, verificamos que R cresce com a heritabilidade, com i e com σσσσ. O que devemos fazer então para ter ganhos elevados? 1. Obter estimativas elevadas de h2, ou seja, reduzir os desvios ambientais nas populações experimentais a submeter a selecção. Isto consegue-se em geral mediante as chamadas técnicas de delineamento experimental. 2. Seleccionar poucos dos melhores individuais, obtendo maior i e maior �. Mas se se exagera, podem sobrevir problemas de endogamia ou de não verificação do ganho estimado. 3. Trabalhar com populações com elevada variabilidade genotípica (ou aditiva) - alto valor de s. Notar porém o seguinte: se se melhora o delineamento experimental de modo a aumentar h2, reduz-se s, pois este é o desvio padrão fenotípico, que baixa quando se eliminam os desvios ambientais. No quadro seguinte indica-se a variação de todos estes parâmetros, relativamente a uma população de 100 clones de videira com média = 1,72 kg/cepa, quando se faz subir o valor de h2 através duma melhoria do delineamento experimental (resultados de simulação em computador). 31 Delineamento experimental h2 σP R, para p.s. = 33% 2 rep x 12 cepas 0,39 0,530 13,2% 3 rep x 8 cepas 0,47 0,487 14,8% 4 rep x 6 cepas 0,52 0,465 15,4% 6 rep x 4 cepas 0,58 0,439 16,3% 8 rep. x 3 cepas 0,62 0,426 16,6% 12 rep. x 2 cepas 0,67 0,413 17,1% 24 re. x 1 cepa 0,71 0,396 17,5% Vistos estes aspectos, dá-se finalmente um exemplo de como se fecharia um trabalho de selecção depois da utilização de todos os dispositivos estatísticos que vimos apresentando. O quadro que segue é a continuação duma análise como a representada na figura 3. Nele figuram várias possíveis proporções de selecção e os correspondentes ganhos previsíveis a obter. A partir daqui podemos tomar a decisão de selecção mais acertada. Por exemplo, se queremos fornecer à viticultura material com rendimento 21,9% superior à média (aqui trata-se de rendimento, mas poderíamos aplicar os mesmos instrumentos a outras características) então seleccionamos 50% dos melhores % selecção i R (ganho) (%) 10 1,7 46,6 15 1,51 41,4 20 1,37 37,5 25 1,25 34,2 30 1,15 31,5 40 0,97 26,6 50 0,8 21,9 60 0,63 17,3 i=0,8 + 0,4 ln (1/p.s.-1) REFERÊNCIAS Allard, R. W. (1971) Princípios do melhoramento genético das plantas. Edgard Blucher, S. Paulo. Chase, W. & Bown, F. (1996) General statistics. John Willey & Sons Inc., New York. Falconer, D. S. (1989) Introdution to quantitative genetics. Longman, London. Lacadena, J.-R. (1976) Genética (2ª ed.). AGESA, Madrid. Snedecor, G (1945) Métodos estatísticos. Ed. Direcção Geral dos Serviços Agrícolas, Lisboa. Sokal, R. & Rolph, R. J. (1995) Biometry. W. H. Freeman & Co., New York. 32 ANEXO 1 Natureza das características quantitativas e consequências quanto à selecção Que fazer? Duas coisas: - reduzir os desvios ambientais, para haver maior coincidência entre valores fenotípicos e genotípicos - quantificar em que medida isso se conseguiu e, a partir daí, estimar o ganho. O problema da redução dos desvios ambientais A formulação matemática do modêlo gráfico do valor fenotípico apresentado acima, envolve os seguintes pressupostos: Ζ os desvios são casuais e de média nula; Ζ σ2E ≠ 0; Ζ o desvio ambiental exerce-se sobre o indivíduo. Então, a redução de E consegue-se com a aplicação das regras do delineamento experimental: 1º - ambiente homogéneo → deste modo, os desvios são globalmente minimizados; 2º - representações dos elementos grandes O desvio médio tende para zero 3º - Repetições e casualização → contribuem para que os desvios sejam casuais e para que a respectiva média tenda para zero As classes genotípicas são identificáveis fenotipicamente, logo, seleccionar sobre o fenótipo é igual a seleccionar sobre o genótipo Menor determinismo genotípico, maior nº de classes, confundição entre classes genotípicas/fenotípicas. A selecção é errónea, pois o fenótipo não corresponde ao genótipo. qualitativas quantitativas G + E = P G + E = P Com casualização, os desvios tendem para zero. Sem casualização, os desvios tendem para um determi- nado sentido. 33 4º Evitar erros (parecidos com a 1ª atitude) O problema de quantificar a que distancia se ficou da completa eliminação dos desvios ambientais e de estimar o ganho O problema da selecção pode assim ser esquematizado R = S x K (0≤K≤1) Portanto, K é um indicador da proximidade entre as distribuições fenotípica/genotípica da população experimental. Como encontrá-lo ? Será melhor voltar aos esquemas Notar que o alargamento da gama de variação fenotípica, em relação à genotípica, é uma medida da não correspondência entre uma e outra. Porque esse alargamento é tanto maior quanto maiores forem os desvios ambientais. Isto verifica-se biologicamente e também é previsto pela matemática (se somarmos aleatoriamente 2 variáveis, a variância das somas é igual à soma das variâncias das partes). Então, o cociente entre as medidas da variação genotípica e fenotípica (variância) serve bem para pôr no lugar da constante K. Este cociente é a heritabilidade em sentido lato 2 2 2 P G G σσσσ σσσσ ====h S G + E = P G + E = P G + E = P (Desvios ambientais nulos) (Desvios ambientais moderados) (Desvios grandes 34 Anexo 2 Segundo Falconer (p. 154, L5) “a covariância é igual à variância das médias dos grupos halfsib”, mas esta passagem não é demonstrada, nem tão pouco é intuitivamente óbvia. Por isso, um sexemplo numérico poderá ajudar e um exemplo de valores concretos n HSDHSHSEHSCOV )()( −−−−−−−−ΣΣΣΣ ==== x (COV=covariância; HS=familia half-sib; E=elemento do lado esquerdo; D=elemento Dto.) Cada um dos 3 grupos de pares representa uma descendência de meios irmãos e cada par contém 2 quaisquer desses irmãos. Assim, os desvios desses valores em relação à respectiva média, por serem colocados numa ou noutra coluna aleatoriamente, não contribuen para a covariância. O que contribui para a covariância é a própria variância das médias dos grupos. Mas será a COV igual à própria variância ? No exemplo numérico apresentado essa igualdade verifica-se. Quanto ao modo de cálculo da correlação intraclasse, t, apresenta-se um exemplo extraído de Snedecor (1945), p. 209. Nesse exemplo, os talhões podem ser vistos como descendência e as repetições exactamente como tal. Origem da variação G.L. S.Q. Q.M. Total 39 Talhões 9 3.12 4A+B Repetições dentro talhões (erro) 30 0.84 B T=A/(A+B) C/ B=0.84 e 4A+B=3.12 A=0.57 T=0.40 u m a d e s c e n d ê n c ia h a lf-s ib d ife re n ç a p a ra a s p ro d u to s e a g ru p a m e n to 2 a 2 m é d ia s , a o fu n d o 3 4 -2 -1 .2 2 .4 3 3 -2 -2 .2 4 .4 5 4 0 -1 .2 0 4 3 -1 -2 .2 2 .2 3 5 -2 -0 .2 0 .4 M e d 3 .6 3 .7 3 .8 o u tra d e s c e n d ê n c ia 4 6 -1 0 .8 -1 .8 6 5 1 -0 .2 -0 .2 4 4 -1 -1 .2 1 .2 4 5 -1 -0 .2 0 .2 5 4 0 -1 .2 0 M e d 4 .6 4 .7 4 .8 o u tra d e s c e n d ê n c ia 6 7 1 1 .8 1 .8 7 6 2 0 .8 1 .6 8 6 3 0 .8 2 .4 5 9 0 3 .8 0 8 7 3 1 .8 5 .4 M e d 6.8 6 .9 7 S O M A 7 5 7 8 2 0 M E D . G . 5 5 .1 5 .2 C O V = 2 0 /1 5 = 1 .3 3 V a r iâ n c ia m é d ia s d o s h a lf s ib s (3 .7 , 4 .7 , 6 .9 ) = 1 .3 3 35 Referências Chase, W. & Bown F. (1996). General Statistics. John Willey & Sons Inc., New York Sokal, R. & Rohlf F.J. (1995). Biometry. W. H. Freman & Co., New York. Falconer, D.S. (1989). Introduction to Quantitative Genetics. Longman, London. Lacadena, J.-R. (1976) Genetica (2ª ed.) AGESA, Madrid. Allard, R.W. (1971) Princípios do Melhoramento Genético das Plantas. Edgard Blucher, S. Paulo. Snedecor G. (1945) - Métodos estatísticos. Ed. Dir. Geral Serviços Agrícolas, Lisboa.
Compartilhar