1.GBK码位分布图
<img src="http://img.blog.csdn.net/20150707173014959?
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast” alt=””>
2.GBK码位说明
GBK 亦採用双字节表示,整体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,当中汉字(包含部首和构件)21003
个,图形符号 883 个。所有编码分为三大部分:
1. 汉字区。
包含:
a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个,按原顺序排列。
b. GB 13000.1 扩充汉字区。包含:
(1) GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。
(2) GBK/4: AA40-FEA0。收录 CJK 汉字和增补的汉字 8160 个。CJK 汉字在前,按 UCS 代码大小排列;增补的汉字(包含部首和构件)在后,按《康熙字典》的页码/字位排列。
2. 图形符号区。
包含:
a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。
当中除 GB 2312 的符号外,还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。
b. GB 13000.1 扩充非汉字区。
即 GBK/5: A840-A9A0。
BIG-5 非汉字符号、结构符和“○”排列在此区。计符号 166 个。
3. 用户自己定义区:分为(1)(2)(3)三个小区。
(1) AAA1-AFFE,码位 564 个。
(2) F8A1-FEFE,码位 658 个。
(3) A140-A7A0,码位 672 个。
第(3)区虽然对用户开放,但限制使用,由于不排除未来在此区域增补新字符的可能性。
url=Hi1z5qUwV8XPhunlRDVkgMuKdOassSy-S9MvCj8djumSeKNFVa7584Mo5kCNphWttbbNoSb7lta-S4dHbaKchaNVvNWxChGN3lbwlx6AuJq” style=”background-color:inherit; font-family:微软雅黑; line-height:1.5″>http://baike.baidu.com/link?url=Hi1z5qUwV8XPhunlRDVkgMuKdOassSy-S9MvCj8djumSeKNFVa7584Mo5kCNphWttbbNoSb7lta-S4dHbaKchaNVvNWxChGN3lbwlx6AuJq
最新评论