Baixe o app para aproveitar ainda mais
Prévia do material em texto
Natureza da Informação - Lista avaliativa 4 No que segue, valores numéricos nos exercícios são baseados na raiz digital do seu RA. Você chega a este número ao somar os dígitos, repetidamente, até chegar a um único dígito – por exemplo, se o número for 1714632 (meu SIAPE), calculo 1+7+1+4+6+3+2 = 24, e, somando os dígitos resultantes de novo, 2+4 = 6. Use este número, determinado para seu RA específico, para substituir 'n' embaixo sempre quando aparecer. Por favor, elabore as suas respostas com 3 dígitos após o ponto decimal – ou seja, com acurácia 0,001. 1. Depois do sequenciamento de um trecho de código-DNA (em um filamento de referência), encontram-se as bases adenina (A), citosina (C), guanina (G) e timina (T), nas seguintes proporções, em porcentagem: A: 40+n% C: 30% G: 20% - T: 100-(40+30+20+n)% A = 43%; C=30%; G=20%; T=7% Proponha uma codificação destas bases (ou seja, estabeleça um mapeamento base - palavra- código) para sequências de DNA usando o método de Shannon-Fano, e, responda a base deste às perguntas que seguem. a) Reproduza os códigos que encontrou para cada uma das bases, e acrescente o tamanho de cada palavra-código: Base Palavra-código Tamanho palavra-código A 0 1 C 10 3 G 110 3 T 111 3 b) Calcule a eficiência ('eta') deste esquema de codificação. Para a eficiência, precisamos do Lbarra. Calculamos ele como qt de dígitos*porcentagem. Logo N=H(S)/(1*0.43+3*0.3+3*0.2+3*0.07) -> N=H(S)/2.14 Se, H(S)=-p(0.43).log_2(0.43) -p(0.3).log_2(0.3) -p(0.2).log_2(0.2) -p(0.07).log_2(0.07) H(S)=1.77759 Por fim, N=1.77759/2.14 N=0.8306 ou 83.06% 2. Uma linguagem (peculiar) usa somente vogais na escrita, e não acrescenta espaços entre palavras. Usam, enfim, somente as seguintes letras, com porcentagens como representadas aqui: A: 36% E: 18% I: 17% O: 16% U: 1 Proponha uma codificação destas letras (ou seja, estabeleça um mapeamento base - palavra- código) para usando o método de Huffman, e, responda a base deste às perguntas que seguem. a) Reproduza os códigos que encontrou para cada uma das bases, e acrescente o tamanho de cada palavra-código: Base Palavra-código Tamanho palavra-código A 0 1 E 111 3 I 110 3 O 101 3 U 100 3 b) Calcule a eficiência ('eta') deste esquema de codificação. Para a eficiência, precisamos do Lbarra. Calculamos ele como qt de dígitos*porcentagem. Logo N=H(S)/(1*0.36+3*0.18+3*0.17+3*0.16+3*0.13) -> N=H(S)/2.28 Se, H(S) = probabilidade*log_2(p) H(S)=2.21617 Por fim, N=2.21617/2.28 N=0.9720 ou 97.2% 3. Uma antropóloga-linguista-cientista da informação pretende fazer um registro de uma linguagem de tambor que usa dois tambores de tons diferentes (ou seja, um agudo e outro grave), além de silêncios. Pela contagem dela, 50+n% das batidas são no tambor grave, 30% no tambor agudo, e 20-n% dos momentos há um período de pausa. Os usuários do sistema produzem 5 destes três "símbolos" por segundo. Problema é que o dispositivo de registro binário é falho, e há uma taxa de erro de bit de 10% (presume canal binário simétrico). a) Qual é a entropia da fonte, H(S)? 0.53 ; 0.30 e 0.17 H(S)=-prob(0.53)*log_2(0.53)-prob(0.3)*log_2(0.3) -prob(0.17)*log_2(0.17) H(S)=1.4411 b) Qual é a capacidade do canal (C) do dispositivo binário de gravação? H(P)= -probabilidade (erro).log_2(prob erro) – (1-prob erro).log_2(1-prob erro) H(P) = -0.1.log_2(0.1)-(1-0.1).log_2(1-0.1) H(P) = 0.4689 Sabendo que C = 1 – H(p), o C=0.5311 c) Qual é, segundo o teorema de codificação de canal, o menor tempo necessário entre dois dígitos binários para compensar pelo erro? Com H(S)/Ts=C/Tc, temos que 1.4411/5=0.5311/Tc Tc=1.84268
Compartilhar