Buscar

Unicode

Prévia do material em texto

Unicode
Unicode é um padrão adotado mundialmente que possibilita com que todos os caracteres de todas linguagens escritas utilizadas no planeta possam ser representados em computadores.
A “missão” do Unicode é apresentada de forma bem clara na web site do Unicode Consortium (entidade responsável pela sua gestão).
Ele fornece um número único para cada caractere, não importa qual a plataforma, não importa qual o programa e não importa qual a linguagem.
O padrão dele é capaz de representar não somente as letras utilizadas pelas linguagens mais “familiares” nós acidentais, como Inglês, Espanhol, Francês, e até mesmo o nosso Português, mas também não podemos de falar das letras e símbolos utilizados em outra linguagem: Russo, Chinês, Japonês, Hebreu, etc. Além disso, inclui símbolos de pontuação, símbolos técnicos e outros caracteres que podem ser utilizados em texto escrito.
Cada diferente letra ou símbolo de cada alfabeto utilizado no mundo é mapeado para um diferente code point. O code é um código no formato U + número em hexadecimal. Segue abaixo o exemplo dos códigos das letras que compõem a palavra “BRASIL” (em maiúsculo).
B - U+0042
R - U+0052
A - U+0041
S - U+0053
I - U+0049
L - U+004C
Não podemos deixar de falar a importância das letras maiúscula e minúscula pois elas possuem códigos diferentes. Por exemplo: o code point da letra ”A” é u+0041, enquanto o da letra “a” é u+0061, o code point de “Ç” é u+00C7 e o de “ç” é u+00E7 (e por aí vai). Uma observação importante é que os primeiros 127 points (até U+007F) são compatíveis com os códigos utilizados na antiga tabela ASCII (são os códigos associados aos números, letras, maiúsculas e minúsculas sem acento e símbolos de pontuação mais comuns).
Podemos entender que o Unicode nada mais é que uma enorme tabela que associa um número único (code point) para cada diferente letra ou símbolo do alfabeto de todo o mundo.
O aplicativo mapa caracteres (charmap) do Windows pode ser utilizado para consultar a tabela do Unicode. Para acessá-lo basta ir para prompt de comando e digitar charmap.
Fonte:https://www.devmedia.com.br/unicode-conceitos-basicos/25169 <acessado em 27/03/2019>

Continue navegando