Lista avaliativa 4 - NI

•

UFABC

4

0

4

0

1

Sarah Nascimento

08/05/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 3 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Natureza da Informação

96 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Natureza da Informação - Lista avaliativa 4 
 
 
No que segue, valores numéricos nos exercícios são baseados na raiz digital do seu RA. Você 
chega a este número ao somar os dígitos, repetidamente, até chegar a um único dígito – por 
exemplo, se o número for 1714632 (meu SIAPE), calculo 1+7+1+4+6+3+2 = 24, e, somando os 
dígitos resultantes de novo, 2+4 = 6. Use este número, determinado para seu RA específico, 
para substituir 'n' embaixo sempre quando aparecer. Por favor, elabore as suas respostas com 
3 dígitos após o ponto decimal – ou seja, com acurácia 0,001. 
 
 
1. Depois do sequenciamento de um trecho de código-DNA (em um filamento de referência), 
encontram-se as bases adenina (A), citosina (C), guanina (G) e timina (T), nas seguintes 
proporções, em porcentagem: 
A: 40+n% 
C: 30% 
G: 20% - 
T: 100-(40+30+20+n)% 
 
A = 43%; C=30%; G=20%; T=7% 
 
Proponha uma codificação destas bases (ou seja, estabeleça um mapeamento base - palavra- 
código) para sequências de DNA usando o método de Shannon-Fano, e, responda a base deste 
às perguntas que seguem. 
a) Reproduza os códigos que encontrou para cada uma das bases, e acrescente o 
tamanho de cada palavra-código: 
 
Base Palavra-código Tamanho palavra-código 
A 0 1 
C 10 3 
G 110 3 
T 111 3 
b) Calcule a eficiência ('eta') deste esquema de codificação. 
Para a eficiência, precisamos do Lbarra. Calculamos ele como qt de dígitos*porcentagem. 
Logo N=H(S)/(1*0.43+3*0.3+3*0.2+3*0.07) -> N=H(S)/2.14 
Se, H(S)=-p(0.43).log_2(0.43) -p(0.3).log_2(0.3) -p(0.2).log_2(0.2) -p(0.07).log_2(0.07) 
H(S)=1.77759 
Por fim, N=1.77759/2.14 
N=0.8306 ou 83.06% 
 
2. Uma linguagem (peculiar) usa somente vogais na escrita, e não acrescenta espaços entre 
palavras. Usam, enfim, somente as seguintes letras, com porcentagens como 
representadas aqui: 
A: 36% 
E: 18% 
I: 17% 
 
 
O: 16% 
U: 1 
 
 
 
Proponha uma codificação destas letras (ou seja, estabeleça um mapeamento base - palavra- 
código) para usando o método de Huffman, e, responda a base deste às perguntas que 
seguem. 
a) Reproduza os códigos que encontrou para cada uma das bases, e acrescente o 
tamanho de cada palavra-código: 
 
Base Palavra-código Tamanho palavra-código 
A 0 1 
E 111 3 
I 110 3 
O 101 3 
U 100 3 
 
b) Calcule a eficiência ('eta') deste esquema de codificação. 
Para a eficiência, precisamos do Lbarra. Calculamos ele como qt de dígitos*porcentagem. 
Logo N=H(S)/(1*0.36+3*0.18+3*0.17+3*0.16+3*0.13) -> N=H(S)/2.28 
Se, H(S) = probabilidade*log_2(p) 
H(S)=2.21617 
Por fim, N=2.21617/2.28 
N=0.9720 ou 97.2% 
 
3. Uma antropóloga-linguista-cientista da informação pretende fazer um registro de uma 
linguagem de tambor que usa dois tambores de tons diferentes (ou seja, um agudo e outro 
grave), além de silêncios. Pela contagem dela, 50+n% das batidas são no tambor grave, 
30% no tambor agudo, e 20-n% dos momentos há um período de pausa. Os usuários do 
sistema produzem 5 destes três "símbolos" por segundo. Problema é que o dispositivo de 
registro binário é falho, e há uma taxa de erro de bit de 10% (presume canal binário 
simétrico). 
a) Qual é a entropia da fonte, H(S)? 
0.53 ; 0.30 e 0.17 
H(S)=-prob(0.53)*log_2(0.53)-prob(0.3)*log_2(0.3) -prob(0.17)*log_2(0.17) 
H(S)=1.4411 
 
b) Qual é a capacidade do canal (C) do dispositivo binário de gravação? 
H(P)= -probabilidade (erro).log_2(prob erro) – (1-prob erro).log_2(1-prob erro) 
H(P) = -0.1.log_2(0.1)-(1-0.1).log_2(1-0.1) 
H(P) = 0.4689 
Sabendo que C = 1 – H(p), o C=0.5311 
 
c) Qual é, segundo o teorema de codificação de canal, o menor tempo necessário entre 
dois dígitos binários para compensar pelo erro? 
Com H(S)/Ts=C/Tc, temos que 1.4411/5=0.5311/Tc 
Tc=1.84268