Baixe o app para aproveitar ainda mais
Prévia do material em texto
Fabiana Diuk de Andrade – RA 16000916 Turma: NI-DA 2017-1 Lista Extra 1) Uma sequência de DNA tem 8 bases do tipo A, C, G ou T. a) Sem qualquer informação adicional sobre as probabilidades de cada uma das bases (ou seja, deve-se assumir que são equiprováveis), determine a entropia inicial sobre como é essa sequência. pA=pC=pG=pT=0,25 H = 4*(-0,25 * log2 0,25) = 2 b) Dado que existem 4 C’s nessa sequência, determine o ganho dessa informação em relação a entropia inicial do item a. pA=0,5 e pC=pG=pT=0,167 H = -0,5 *log20,5 + 3*(-0,167 * log20,167) = 1,79 Ganho de 0,21 bits c) Dado que esses 4 C’s estão localizados na primeira, terceira, quinta e sétima posições, determine o ganho dessa informação em relação a entropia inicial do item a. pA=0,5 e pC=pG=pT=0,167 H = -0,5 *log20,5 + 3*(-0,167 * log20,167) = 1,79 Ganho de 0,21 bits d) Dado que existem 4 C’s, 2 G’s, 1 T e 1 A, e que os 4 C’s estão localizados nas mesmas posições definidas no item c, calcule o ganho dessa informação em relação a entropia inicial do item a. pA=0,5; pC=0,25; pG=pT=0,125 H = -0,5 *log20,5 – 0,25 * log20,25 + 2*(-0,125 * log20,125) = 1,75 Ganho de 0,25 bits e) Determine a eficiência entrópica do código obtido pelo melhor método conhecido para comprimir a mensagem com as probabilidades das bases determinadas no item d. H = 1,75 e L = 0,5*1+0,25*2+0,125*3+0,125*3 = 1,75 = 1 2) O código genético de um determinado alienígena possui 3 tipos de bases nitrogenadas: A, B e C. Além disso, seus códons são sequências (palavras código) de 3 bases, onde um ou mais códons podem codificar para um mesmo aminoácido, assim como ocorre no código genético dos terrestres. No código genético do alienígena existem 8 tipos de aminoácidos: D, E, F, G, H, I, J, K. As probabilidades de cada um desses aminoácidos são: P(D) = P(E) = 1/4; P(F) = P(G) = P(H) = 1/8; P(I) = 1/16; P(J) = P(K) = 1/32. a) Com base nessas probabilidades, proponha uma codificação com redundância apropriada para esses aminoácidos considerando todos os códons possíveis (de 3 bases), onde cada um dos códons deve mapear para um determinado aminoácido (assim como acontece com o código genético dos terrestres). A B C A AAA AAB AAC ABA ABB ABC ACA ACB ACC A B BAA BAB BAC BBA BBB BBC BCA BCB BCC B C CAA CAB CAC CBA CBB CBC CCA CCB CCC C D = 27/4 = 6,75 8 AAA, AAB, AAC, ABA, ABB, ABC, ACA, AAA E = 27/4 = 6,75 8 ACB, ACC, BAA, BAB, BAC, BBA, BBB, BBB F = 27/8 = 3,38 4, BBC, BCA, BCB, BBC G = 27/8 = 3,38 4 BCC, CAA, CAB, BCC H = 27/8 = 3.38 4 CAC, CBA, CBB, CBB I = 27/16 = 1,69 2 CBC, CCA J = 27/32 = 0,84 1 CCB K = 27/32 = 0,84 1 CCC b) Quantos bits de redundância existem no código genético do alienígena em questão? Qual código genético é mais eficiente: o dos seres terrestres ou o do alienígena em questão? Justifique. (entropia dos aminoácidos dos terrestres é de 4,21 bits) Alienígena 5-2,69 = 2,31 bit de redundância H = 2 *(-0,25*log20,25) + 3*(-0,125*log20,125) - 0,0625 * log2 0,0625 + 2 *(-0,03125*log2 0,03125) = 2,69 L = 3*1/4+3*1/4+3*1/8+3*1/8+3*1/8+3*1/16+3*1/32+3*1/32 = 3 = 2,69/3 = 0,9 Humanos 6-4,21 = 1,79 bit de redundância H = 4,21 L = 0,03125*3*12+0,0625*3*8+0,0469*3*2+0,0156*3*2 = 3 = 4,21/3 = 1,40 c) Qual é a eficiência do código de Huffman aplicado ao código genético dos alienígenas? H = 2 *(-0,25*log20,25) + 3*(-0,125*log20,125) - 0,0625 * log2 0,0625 + 2 *(-0,03125*log2 0,03125) = 2,69 L = 2*1/4+2*1/4+3*1/8+3*1/8+3*1/8+4*1/16+5*1/32+5*1/32 = 2,69 = 2,69/2,69 = 1 d) Discuta porque a evolução dos seres vivos acabou não resultando numa convergência da eficiência do código genético para a otimalidade. 3) A sequência binária a seguir representa um trecho de código genético. Sabe-se que a existência da sequência de bits 011100 representa o início de uma transcrição de RNA e o código 100110 o fim desta transcrição. ... 1011100010110011011000111101110001110010100110001... a) Analise o trecho acima fazendo comentários a respeito do número de genes transcritos dependendo do sentido (fita negativa ou positiva) e mostre quais seriam os códigos desses genes (incluindo os códigos de início e fim da transcrição). b) Sendo o código 00->A, 01->T ou U, 10->C e 11->G, determine as cadeias binárias para o RNA resultante de cada gene. c) A partir da frequência de aparecimento das bases, calcule a entropia para a expressão de cada gene encontrado (incluindo os códigos de início e fim da transcrição).
Compartilhar