GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。GBK编码依然采用双字节编码方案,其编码范围:8140-FEFE(高字节从81到FE,低字节) 从40到FE),清晰除xx7F码位,***23940个码位。
GBK编码***收录汉字和图形符号21886个,其中汉字(包括部首和字节)21003个 ,图形符号883个。GBK编码支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。GBK编码方案于1995年12月15日 正式发布,该版本的GBK规范为1.0版本。
扩展数据:
全部编码分成三部分:
1、汉字区。
包括:
a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个,按原顺序排列。
b. GB 2312 汉字区。 GB 13000.1 新增汉字区。包括:
<(1)、 GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。
<(2) 、GBK/ 4: AA40-FEA0。收录中日韩汉字和增补的汉字8160个。中日韩汉字在前,按UCS代码大小排列;增补的汉字(包括部首和组成)在后,按《康熙字典》的页码/字位 排列。
(3)、汉字“〇”排列在图形符号区GBK/5:A996。
2、图形符号区。
包括:
a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符号外,还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。
b. GB 13000.1 增加非汉字区。即GBK/5: A840-A9A0。BIG-5非汉字符号、结构符和“〇”排列此区。计符号166个。
3、用户自 定义区域:
分成(1)(2)(3)三个小区。
(1)、 AAA1-AFFE,码位564个。
< p>(2) 、F8A1-FEFE,码位 658 个。(3) 、A140-A7A0,码位 672 个。
第(3)区虽然对用户 开放,但限制使用,因为不排除未来该区域增补新字符的可能性。