Convenio
internacional para representar caracteres de múltiples idiomas en 16 bits. Es
el convenio que usa java. Los detalles pueden verse en
http://www.unicode.org/charts/
La siguiente tabla recoge los códigos que nos
afectan en el suroeste de Europa:
ISO-Latin-1 |
||
decimal |
carácter |
hexadecimal |
32 a 47 |
! " # $ % ' ( ) * + , - . / |
20 a 2F |
48 a 63 |
0 1 2 3 4 5 6 7 8 9 : ; < = > ? |
30 a 3F |
64 a 79 |
@ A B C D E F G H I J K L M N O |
40 a 4F |
80 a 95 |
P Q R S T U V W X Y Z [ ] ^ _ |
50 a 5F |
96 a 111 |
` a b c d e f g h i j k l m n o |
60 a 6F |
112 a 126 |
p q r s t u v w x y z { | } ~ |
70 a 7F |
160 a 175 |
¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ ® ¯ |
A0 a AF |
176 a 191 |
° ± ² ³ ´ µ ¶ · ¸ ¹ º » ¼ ½ ¾ ¿ |
B0 a BF |
192 a 207 |
À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï |
C0 a CF |
208 a 223 |
Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß |
D0 a DF |
224 a 239 |
à á â ã ä å æ ç è é ê
ë ì í î ï |
E0 a EF |
240 a 255 |
ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ |
F0 a FF |
No se “ve” en la
tabla; pero el código 32 (20 en hexadecimal) corresponde al carácter “espacio
en blanco”.
No se ve en la
tabla; pero el código hexadecimal 7F corresponde a la tecla DEL (“borrado”).
Java permite expresar
los caracteres usando el código Unicode hexadecimal. Por ejemplo, el carácter
'A' que tiene el código hexadecimal 41 se puede escribir
'A' ® 'u0041'
lo que es
perfectamente absurdo para caracteres normales; pero puede ser útil para los
caracteres que no suelen aparecer en nuestros teclados.
Se pueden
escribir cadenas de caracteres (String) con el mismo convenio.
"José" ® "u004au006fu0073u00e8"
Vea "codificación de caracteres" donde se explica cómo se utilizan
bytes (8 bits) para guardar caracteres (16 bits).
Temas relacionados