Baixe o app para aproveitar ainda mais
Prévia do material em texto
JONNATHAS HENRIQUE LUDOVICO CARVALHO RA:11123915 TURMA A - SBC – NOTURNO PROF. DR GUIOU KOBAYASHI – BC0504 – NATUREZA DA INFORMAÇÃO 1) Por que run-length pode ser considerado um exemplo de detecção de redundância? Esse algoritmo garante economia de espaço? Em que circunstâncias o algoritmo resulta num arquivo maior que o original? Pois ele classifica a mensagem como símbolo e número de vezes que o mesmo ocorre, podendo dessa forma encontrar símbolos iguais, garante economia de espaço no caso de ser uma repetição longa de poucos símbolos apenas, se a mensagem conter diversos símbolos diferentes e que exista pouca repetição. 2) Como as sequências a seguir seriam codificadas com run-lenght? AAABBBBBBYYYYPPPPPPPPPTKKKKKKKK A [3] B [6] Y [4] P [9] T [1] K [8] b) 111112223333312222221111111333333333 1[5] 2[3] 3[5] 1[1] 2[2] 1[7] 3[9] 3) Qual porcentagem de compressão foi conseguida em cada caso no exercício anterior? a) 80,6% b) 80,6% 4) Considere a mensagem “abbababac”, onde a é codifica do como 1, b como 2 e c como 3. Como ela seria transmitida nos seguintes casos? a) Codificação run- length: Mensagem original tem 9 códigos, mensagem codificada tem 8 códigos: 1[1] 2[2] 1 [1] 2[1] 1[1] 2 [1] 1[1] 3[1] b) Compressão LZW. Considere que, no dicionário inicial, a = 1, b = 2 e c = 3. Mostre os passos realizados. Mensagem original tem 9 códigos, mensagem codificada tem 8 códigos : Codificação transmissão Decodificação Entrada Nova_entrada dicionário Nova_entrada dicionário Saída 1 a -- 4(start) -- -- 2 b 6 ab 1 a -- a 2 b 7 bb 2 b 6 ab b 1 a 8 ba 2 b 7 bb b 2 b -- -- -- -- 1 a 9 aba 6 ab 8 ba ab 2 b -- -- -- -- 1 a -- -- -- -- 3 c 10 abac 9 aba 9 aba aba -- 3 c 10 abac c 5(stop) c) Qual algoritmo foi mais efetivo na compressão? Ambos são iguais, pois codificaram 8 códigos diminuindo em 11% a mensagem inicial que possui 9 códigos. 5) Mostre os passos da compressão LZW para as sequências (consultando tabela ASCII dos slides de aula): a) abcabca: 7 x 8 bits = 56 bits Codificação transmissão Decodificação Entrada Nova_entrada dicionário 9 bits Nova_entrada dicionário Saída 097 a -- 256(start) -- -- 098 b 258 ab 097 a -- 097 a 099 c 259 bc 098 b 258 ab 098 b 097 a 260 ca 099 c 259 bc 099 c 098 b -- -- -- -- 099 c 261 abc 258 ab 260 ca 258 ab 097 a 260 ca 261 abc 260 ca 257(stop) Compressão LZW: 7 x 9 b its = 63 bits, aumento de 12,5 % b)AABCBBABC : 9 x 8 bits = 72 bits Codificação transmissão Decodificação Entrada Nova_entrada dicionário 9 bits Nova_entrada dicionário Saída 065 A -- 256(start) -- -- 065 A 258 AA 065 A -- 065 A 066 B 259 AB 065 A 258 AA 065 A 067 C 260 BC 066 B 259 AB 066 B 066 B 261 CB 067 C 260 BC 067 C 066 B 262 BB 066 B 261 CB 066 B 065 A 263 BA 066 B 262 BB 066 B 066 B -- -- -- -- 067 C 264 ABC 259 AB 263 BA 259 AB 067 C 264 ABC 067 C 257(stop) Compressão LZW : 10 x 9 bits = 90 bits aumento de 25 % c)W E W E R E T H E R E W E W E R E H E R E : 21 x 8 = 168 bits Codificação transmissão Decodificação Entrada Nova_entrada dicionário 9 bits Nova_entrada dicionário Saída 087 W -- 256(start) -- -- 069 E 258 WE 087 W -- 087 W 087 W 259 EW 069 E 258 WE 069 E 069 E -- -- -- -- 082 R 260 WER 258 WE 259 EW 258 WE 069 E 261 RE 082 R 260 WER 082 R 084 T 262 ET 069 E 261 RE 069 E 072 H 263 TH 084 T 262 ET 084 T 069 E 264 HE 072 H 263 TH 072 H 082 R 265 ER 069 E 264 HE 069 E 069 E -- -- -- -- 087 W 266REW 261 RE 265 ER 261 RE 069 E -- -- -- -- 087 W 267 WEW 258 WE 266 REW 258 WE 069 E -- -- -- -- 082 R -- -- -- -- 069 E 268 WERE 260 WER 267 WEW 260 WER 072 H 269 EH 069 E 268 WERE 069 E 069 E -- -- -- -- 082 R 270 HER 264 HE 269 EH 264 HE 069 E 261 RE 270 HER 261 RE 257(stop) Compressão LZW : 16 x 9 b its = 144 bits diminuição de 14,3 % d) ABRACADABRA : 11 x 8 = 88 bits Codificação transmissão Decodificação Entrada Nova_entrada dicionário 9 bits Nova_entrada dicionário Saída 065 A -- 256(start) -- -- 066 B 258 AB 065 A -- 065 A 082 R 259 BR 066 B 258 AB 066 B 065 A 260 RA 082 R 259 BR 082 R 067 C 261 AC 065 A 260 RA 065 A 065 A 262 CA 067 C 261 AC 067 C 068 D 263 AD 065 A 262 CA 065 A 065 A 264 DA 068 D 263 AD 068 D 066 B -- -- -- -- 082 R 265 ABR 258 AB 264 DA 258 AB 065 A 260 RA 265 ABR 260 RA 257(stop) Compressão LZW : 11 x 9 b its = 99 bits aumento de 12,5 % e)BABAABAAA : 9 x 8 = 72 bits Codificação transmissão Decodificação Entrada Nova_entrada dicionário 9 bits Nova_entrada dicionário Saída 066 B -- 256(start) -- -- 065 A 258BA 066 B -- 066 B 066 B 259AB 065 A 258 BA 065 A 065 A -- -- -- -- 065 A 260BAA 258 BA 259 AB 258 BA 066 B -- -- -- -- 065 A 261ABA 259 AB 260 BAA 259 AB 065 A 262AA 065 A 261 ABA 065 A 065 A 262 AA 262 AA 262 AA 257(stop) Compressão LZW : 8 x 9 b its = 72 bits, sem ganho 6) Que compressão é conseguida em cada caso do exercício anterior? Respostas nos itens anteriores 7) A mensagem abaixo representa um código construído pelo método LZW utilizando como dicionário inicial o código ASCII de 8 bits. 256 65 66 65 258 67 67 258 66 265 67 257 a) Sabendo-se que as letras A, B e C são representadas pelos códigos 65, 66 e 67, respectivamente, e que os códigos de início e de final de mensagem são dados pelos códigos 256 e 257, respectivamente, qual é a mensagem original? ABAABCCABBBBC b) Como cada pacote emitido pelo LZW consiste de um a sequência de 9 bits, qual foi a taxa de compressão obtida em relação ao texto puro em ASCII de 8 bits? 13*9=117bits(original) 12*8=96 bits Compressão de 17,95% 8) Sejam as duas mensagens seguintes: i) AAAAAAAAAAAAAAAAAAAABBBBBBBBBBBBBBBBBBBB ii) ABABABABABABABABABABABABABABABABABABABAB a) A codificação run-length teria um bom desempenho para comprimir a mensagem i? E com relação à compressão da mensagem ii? Justifique. Run-length seria ótima para a primeira, visto que a técnica é excepcional em casos de grandes cadeias de caracteres repetidos, o que faz com que ela tenha um péssimo desempenho para mensagens como a segunda. b) A técnica LZW teria um bom desempenho para comprimir a mensagem i? E com relação à compressão da mensagem ii? Justifique. Não tão bom quanto a run-length, mas seria melhor que mandar a mensagem original, já que ela encurtaria as cadeias de caracteres ligeiramente, já em relação a segunda mensagem, ela seria ótima por se tratar da mesma sequencia AB, onde ela diminuiria em quase 50% o tamanho do código. 9) Em que casos se recomenda o uso de compressão com ou sem perda? Discuta. É usada em casos em que é importante que os dados originais e descomprimidos sejam idênticos (ou desvios nos dados originais podem ser prejudiciais). Pode ser reconstruído exatamente a partir da versão comprimida, usualmente explora redundâncias. Não há algoritmo sem perda eficiente para todos os tipos de dados possíveis. Sequências de dados completamente aleatórias não podem ser comprimidas. Compressão tem sucesso quando a sequência resultante é menor que a sequênciaoriginal, incluindo o mapa necessário para descompressão. Por exemplo: 25.888888888 25[9]8 a cadeia original pode ser perfeitamente recriada. Já compressão com perda ou irreversível o símbolo original/codificado não pode ser reconstruído exatamente a partir da versão comprimida. Mas não necessariamente implica que a qualidade do resultado é reduzida. Para dados visuais ou auditivos, alguma perda de qualidade pode ser tolerada sem perder a natureza essencial dos dados levando em consideração limitações da fisiologia humana. Compressão com perda é usada frequentemente na Internet e em produtos de consumo. Do Exemplo anterior: 26. O dado exato é perdido, porém há o benefício de uma codificação menor. 10) Dada a expressão booleana: ~(~(~A+B) + ~ (~C. D)). ~ D a) Monte o seu circuito lógico. b) Suponha que A, B, C e D sejam mecanismos no estado ligado. Qual o resultado da expressão? ~ (~ (0 +1) +~ (0.1)).0 = 0 c) Monte a tabela- verdade da expressão. Simplifique o circuito tanto através do resultado da tabela verdade como utilizando as propriedades da álgebra Booleana. A B C D ~A ~A+B ~C ~C.D ~D ~(~A+B) ~(~C.D) ~(~A+B)+ ~(~C.D) ~(~(~A+B)+ ~(~C.D)) X 0 0 0 0 1 1 1 0 1 0 1 1 0 0 0 0 0 1 1 1 1 1 0 0 0 0 1 0 0 0 1 0 1 1 0 0 1 0 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 0 0 0 1 0 0 1 1 1 0 1 0 1 1 0 0 0 1 0 1 1 1 1 1 0 0 0 0 1 0 0 1 1 0 1 1 0 0 1 0 1 1 0 0 0 1 1 1 1 1 0 0 0 0 1 1 0 0 1 0 0 0 0 0 1 0 1 1 1 1 0 0 1 0 0 1 0 0 1 1 0 1 0 1 0 0 1 0 1 0 0 0 0 0 1 1 1 1 0 0 1 0 1 1 0 0 0 0 0 1 1 1 0 0 1 1 0 0 0 1 1 0 1 0 1 1 0 0 1 1 0 1 0 1 1 1 0 0 0 0 1 0 1 1 1 0 0 1 0 0 1 0 1 1 0 0 1 1 1 1 0 1 0 0 0 0 1 1 0 0 1)Dado o circuito lógico a seguir: a) Qual é a expressão booleana equivalente? ~ ((A. B) + (C.D)) b) Supondo que A e D estejam desligados, qual é o resultado final do circuito lógico? A B C D A.B C.D (A.B) + (C.D) ~((A.B) + (C.D)) 0 X X 0 0 0 0 1 c)Monte a tabela verdade da expressão encontrada. A B C D A.B C.D (A.B) + (C.D) ~((A.B) + (C.D)) 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0 1 0 0 1 1 0 1 1 0 0 1 0 0 0 0 0 1 0 1 0 1 0 0 0 1 0 1 1 0 0 0 0 1 0 1 1 1 0 1 1 0 1 0 0 0 0 0 0 1 1 0 0 1 0 0 0 1 1 0 1 0 0 0 0 1 1 0 1 1 0 1 1 0 1 1 0 0 1 0 1 0 1 1 0 1 1 0 1 0 1 1 1 0 1 0 1 0 1 1 1 1 1 1 1 0 12) Considere três variáveis booleanas A, B e C, em que A = 1, B = 0 e C = 1. Avalie o resultado das expressões: (OBS: negação tem maior prioridade) a) (AB)+C = 1 b) A.( BC) = 1 c) ABC = 0 d) ~ AC = 1 e) ~ B. ~C = 0 13) Monte as tabelas verdade das expressões do exercício anterior. a) (AB)+C A B C AB (AB)+C 0 0 0 0 0 0 0 1 0 1 0 1 0 1 1 0 1 1 1 1 1 0 0 1 1 1 0 1 1 1 1 1 0 0 0 1 1 1 0 1 b)A.( BC) A B C BC A.( BC) 0 0 0 0 0 0 0 1 1 0 0 1 0 1 0 0 1 1 0 0 1 0 0 0 0 1 0 1 1 1 1 1 0 1 1 1 1 1 0 0 c)ABC A B C AB ABC 0 0 0 0 0 0 0 1 0 1 0 1 0 1 1 0 1 1 1 0 1 0 0 1 1 1 0 1 1 0 1 1 0 0 0 1 1 1 0 1 d) ~ AC A B C ~A ~ AC 0 0 0 1 1 0 0 1 1 0 0 1 0 1 1 0 1 1 1 0 1 0 0 0 0 1 0 1 0 1 1 1 0 0 0 1 1 1 0 1 e) ~ B. ~C A B C ~B ~ C ~ B. ~C 0 0 0 1 1 1 0 0 1 1 0 0 0 1 0 0 1 0 0 1 1 0 0 0 1 0 0 1 1 1 1 0 1 1 0 0 1 1 0 0 1 0 1 1 1 0 0 0 14) Calcule as seguintes expressões de aritmética booleana: a) 101101 + 1111 = 111100 b) 1000011 x 110 = 110010010 c) 1110 – 101 = 1001 d) 1001 / 11 = 11 e) 1010111 + 111111 = 10010110 f) 11111 – 111 = 11000 g) 10001 x 100 = 1000100 h) 11100010 / 1010 = 10110,10011 15) Realize as seguintes somas e subtrações (com complemento de 2): a) 1101 + 110 = 10011 b) 1000 – 111 = 001 c) 101011 + 101010 = 1010101 d) 10100 – 1111 = 101 e) 1111 + 1 = 10000 f) 10001 – 1110 = 11 g) 111 + 11 = 1010 h) 10101 – 1010 = 1011 16) Para os seguintes pares de números: I. A = 1100 e B = 0100 II. A = 10000 e B = 00010 III. A = 11110 e B = 01111 Calcule os valores de: a) A + B I) 1100 + 0100 = 10000 II) 10000 + 00010 = 10010 III) 11110 + 01111 = 101101 A – B I) 1100 - 0100 = 1000 II) 10000 - 00010 = 1110 III) 11110 - 01111 = 1111 A x B I) 1100 x 0100 = 110000 II) 10000 x 00010 = 100000 III) 11110 x 01111 = 111000010 A / B I) 1100 / 0100 = 11 II) 10000 / 00010 = 1000 III) 11110 / 01111 = 10 b) A AND B I) 1100 AN D 0100 = 0100 II) 10000 AN D 00010 = 00000 III) 11110 AN D 01111 = 01110 A OR B I) 1100 OR 0100 = 1100 II) 10000 OR 00010 = 10010 III) 11110 O R 01111 = 11111 A XOR C I) 1100 XO R 0100 = 1000 II) 10000 XO R 00010 = 10010 III) 11110 XO R 01111 = 10001 Neste caso a operação deve ser realizada bit a bit. Exemplo: 1001 AND 0101 = 0001 17) Um projetista de sua empresa passou os seguintes circuitos, codificados em álgebra booleana para você construir. Você sabe que o projetista conhece pouco sobre álgebra booleana. Desenhe os circuitos abaixo utilizando portas lógicas, primeiro simplificando o circuito para que ele utilize menos portas. _ _ _ _ _ AB + AB + ABC + ABC = AB (1 + C + C) + AB = AB (1 + 1) + AB=AB(1)+ _ _ _ AB = AB + AB + B (A + A) = B (1) = B _ _ _ _ _ _ _ _ b) ABC + ABC + ABC + ABC = BC (A + A) + AB (C + C) = BC + AB __ ___ __ _ _ _ __ _ c) A • (AB) • (A+B) = A (AB) A.B = A.A (AB). B = 0 18) O código genético de um determinado alienígena possui 3 tipos de bases nitrogenadas: A, B e C. Além disso, seus códons são sequências (palavras código) de 3 bases, onde um ou mais códons podem codificar para um mesmo aminoácido, assim como ocorre no código genético dos terrestres. No código genético do alienígena existem 8 tipos de aminoácidos: D, E, F, G, H, I, J, K. As probabilidades de cada um desses aminoácidos são: P(D) = P(E) = 1/4; P(F) = P(G) = P(H) = 1/8; P(I) = 1/16; P(J) = P(K) = 1/32. a) Com base nessas probabilidades, proponha uma codificação com redundância apropriada para esses aminoácidos considerando todos os códons possíveis (de 3 bases), onde cada um dos códons deve mapear para um determinado aminoácido (assim como acontece com o código genético dos terrestres). A B C A AAA AAB AAC ABA ABB ABC ACA ACB ACC A B BAA BAB BAC BBA BBB BBC BCA BCB BCC B C CAA CAB CAC CBA CBB CBC CCA CCB CCC C D = 27/4 = 6,75 → 8 AAA, AAB, AAC, ABA, ABB, ABC, ACA, AAA E = 27/4 = 6,75 → 8 ACB, ACC, BAA, BAB, BAC, BBA, BBB, BBB F = 27/8 = 3,38 → 4, BBC, BCA, BCB, BBC G = 27/8 = 3,38 → 4 BCC, CAA, CAB, BCC H = 27/8 = 3.38 → 4 CAC, CBA,CBB, CBB I = 27/16 = 1,69 → 2 CBC, CCA J = 27/32 = 0,84 → 1 CCB K = 27/32 = 0,84 → 1 CCC b) Quantos bits de redundância existem no código genético do alienígena em questão? Qual código genético é mais eficiente: o dos seres terrestres ou o do alienígena em questão? Justifique. (entropia dos aminoácidos dos terrestres é de 4,21 bits) Alienígena 5-2,69 = 2,31 bits de redundância H = 2 *(-0,25*log20,25) + 3*(-0,125*log20,125) - 0,0625 * log2 0,0625 + 2 *(- 0,03125*log2 0,03125) = 2,69 L = 3*1/4+3*1/4+3*1/8+3*1/8+3*1/8+3*1/16+3*1/32+3*1/32 = 3 = 2,69/3 = 0,9 Humanos 6-4,21 = 1,79 bits de redundância H = 4,21 L = 0,03125*3*12+0,0625*3*8+0,0469*3*2+0,0156*3*2 = 3 = 4,21/3 = 1,40 c) Qual é a eficiência do código de Huffman aplicado ao código genético dos alienígenas? H = 2 *(-0,25*log20,25) + 3*(-0,125*log20,125) - 0,0625 * log2 0,0625 + 2 *(- 0,03125*log2 0,03125) = 2,69 L = 2*1/4+2*1/4+3*1/8+3*1/8+3*1/8+4*1/16+5*1/32+5*1/32 = 2,69 = 2,69/2,69 = 1 d) Discuta porque a evolução dos seres vivos acabou não resultando numa convergência da eficiência do código genético para a otimalidade. Por que partes do código genético é destinada a estruturação do mesmo, sendo assim impossível de chegar a um nível ótimo de eficiência. 19) Uma sequência de DNA tem 8 bases do tipo A, C, G ou T. a) Sem qualquer informação adicional sobre as probabilidades de cada uma das bases (ou seja, deve-se assumir que são equiprováveis), determine a entropia inicial sobre como é essa sequência. pA=pC=pG=pT=0,25 H = 4*(-0,25 * log2 0,25) = 2 b) Dado que existem 4 C’s nessa sequência, determine o ganho dessa informação em relação a entropia inicial do item a. pA=0,5 e pC=pG=pT=0,167 H = -0,5 *log20,5 + 3*(-0,167 * log20,167) = 1,79 Ganho de 0,21 bits c) Dado que esses 4 C’s estão localizados na primeira, terceira, quinta e sétima posições, determine o ganho dessa informação em relação a entropia inicial do item a. pA=0,5 e pC=pG=pT=0,167 H = -0,5 *log20,5 + 3*(-0,167 * log20,167) = 1,79 Ganho de 0,21 bits d) Dado que existem 4 C’s, 2 G’s, 1 T e 1 A, e que os 4 C’s estão localizados nas mesmas posições definidas no item c, calcule o ganho dessa informação em relação a entropia inicial do item a. pA=0,5; pC=0,25; pG=pT=0,125 H = -0,5 *log20,5 – 0,25 * log20,25 + 2*(-0,125 * log20,125) = 1,75 Ganho de 0,25 bits e) Determine a eficiência entrópica do código obtido pelo melhor método conhecido para comprimir a mensagem com as probabilidades das bases determinadas no item d. H = 1,75 e L = 0,5*1+0,25*2+0,125*3+0,125*3 = 1,75 → = 1 20) A sequência binária a seguir representa um trecho de código genético. Sabe-se que a existência da sequência de bits 011100 representa o início de uma transcrição de RNA e o código 100110 o fim desta transcrição. ... 1011100010110011011000111101110001110010100110001... ... 1011100010110011011000111101110001110010100110001... a) Analise o trecho acima fazendo comentários a respeito do número de genes transcritos dependendo do sentido (fita negativa ou positiva) e mostre quais seriam os códigos desses genes (incluindo os códigos de início e fim da transcrição). A primeira linha mostra o número da esquerda para a direita, e a segunda da direita para a esquerda b) Sendo o código 00->A, 01->T ou U, 10->C e 11->G, determine as cadeias binárias para o RNA resultante de cada gene. Esquerda para a direita →TT→TGCAC→C Direita para a esquerda →TGTGCAGT c) A partir da frequência de aparecimento das bases, calcule a entropia para a expressão de cada gene encontrado (incluindo os códigos de início e fim da transcrição).
Compartilhar