173.Unicode (concepto)

Convenio internacional para representar caracteres de múltiples idiomas en 16 bits. Es el convenio que usa java. Los detalles pueden verse en

http://www.unicode.org/charts/

 

La siguiente tabla recoge los códigos que nos afectan en el suroeste de Europa:

ISO-Latin-1

decimal

carácter

hexadecimal

32 a 47

  ! " # $ % ' ( ) * + , - . /

20 a 2F

48 a 63

0 1 2 3 4 5 6 7 8 9 : ; < = > ?

30 a 3F

64 a 79

@ A B C D E F G H I J K L M N O

40 a 4F

80 a 95

P Q R S T U V W X Y Z [  ] ^ _

50 a 5F

96 a 111

` a b c d e f g h i j k l m n o

60 a 6F

112 a 126

p q r s t u v w x y z { | } ~ 

70 a 7F

160 a 175

  ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ ­ ® ¯

A0 a AF

176 a 191

° ± ² ³ ´ µ ¶ · ¸ ¹ º » ¼ ½ ¾ ¿

B0 a BF

192 a 207

À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï

C0 a CF

208 a 223

Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß

D0 a DF

224 a 239

à á â ã ä å æ ç è é ê ë ì í î ï

E0 a EF

240 a 255

ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ

F0 a FF

 

No se “ve” en la tabla; pero el código 32 (20 en hexadecimal) corresponde al carácter “espacio en blanco”.

No se ve en la tabla; pero el código hexadecimal 7F corresponde a la tecla DEL (“borrado”).

Java permite expresar los caracteres usando el código Unicode hexadecimal. Por ejemplo, el carácter 'A' que tiene el código hexadecimal 41 se puede escribir

'A' ® 'u0041'

 

lo que es perfectamente absurdo para caracteres normales; pero puede ser útil para los caracteres que no suelen aparecer en nuestros teclados.

Se pueden escribir cadenas de caracteres (String) con el mismo convenio.

"José" ® "u004au006fu0073u00e8"

 

Vea "codificación de caracteres" donde se explica cómo se utilizan bytes (8 bits) para guardar caracteres (16 bits).

Temas relacionados

Vademécum