2.
Unicode编码解决了不同平台、不同国家语言的问题,它兼容ASCII码,对其他文字重新进行编码,可以在Windows操作系统记事本软件中输入字符,保存为Unicode格式(big endian),再查看内码。如字符“汉字”的内码如图所示。
其中FE FF为Unicode big endian标记,字符“汉”对应的内码是“6C 49”,“字”对应的内码是“5B 57”。
UTF-8是针对Unicode的一种 可变长度字符编码。它可以用来表示Unicode标准中的任何字符,它的编码规则如下:
Unicode符号范围 (十六进制) 0000 0000-0000 007F 0000 0080-0000 07FF 0000 0800-0000 FFFF 0001 0000- 0010 FFFF | UTF-8编码方式 (二进制) 0xxxxxxx 110xxxxx 10xxxxxx 1110xxxx 10xxxxxx 10xxxxxx 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx |
其中x部分为字符的Unicode编码,不足的前面补0,如汉字“浙”的Unicode码是6D59(二进制为0110 1101 0101 1001),介于0800与FFFF之间,转换为UTF-8编码就是1110 0110 10 110101 10 011001(其中蓝色斜体部分就是编码规则中的x)。
请完成下列问题: