[关闭]
@lasdtc 2013-11-21T15:14:37.000000Z 字数 2023 阅读 994

编码

字符编码

1. ASCII码(American Standard Code for Information Interchange)

2. GB2312

3. GBK 标准

因为当时各个国家都像中国这样搞出一套自己的编码标准,结果互相之间谁也不懂谁的编码,谁也不支持别人的编码。当时的中国人想让电脑显示汉字,就必须装上一个”汉字系统”,专门用来处理汉字的显示、输入的问题,装错了字符系统,显示就会乱了套。

4. UNICODE(Universal Multiple-Octet Coded Character Set)

5. UTF(UCS Transfer Format)

Unicode UTF-8
0000 – 007F 0xxxxxxx
0080 – 07FF 110xxxxx 10xxxxxx
0800 – FFFF 1110xxxx 10xxxxxx 10xxxxxx
例如”汉”字的Unicode编码是6C49。6C49在0800-FFFF之间,所以要用3字节模板:1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二进制是:0110 1100 0100 1001,将这个比特流按三字节模板的分段方法分为0110 110001 001001,依次代替模板中的x,得到:1110-0110 10-110001 10-001001,即E6 B1 89,这就是其UTF8的编码。

6. 其它

二进制编码

1. 反码和补码

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注