GB2312,全称GB2312-80《信息交换用汉字编码字符集 基本集》,于1980年发布。该编码字符集根据GB 2311《信息技术 字符代码结构与扩充技术》(ISO/IEC 2022)提供的扩充技术,通过对GB 1988《信息技术 信息交换用ISO七位编码字符集》(ISO 646,ASCII)所规定C0控制集和G0图形字符集进行替换和扩充,形成双字节编码的新的编码字符集。规定了6763个汉字和682个非汉字图形。
按照GB 2311的规定,图形字符在8位(或7位)代码中应具有由1个或多个8位(或7位)位组(字节)构成的编码表示,而由单个位组表示的每个字符所在的编码图形字符集应是94字符集(0x21~0x7E或0xA1~0xFE)或96字符集(0x20~0x7F或0xA0~0xFF)。如此,每个字符通过n个位组串列表示的编码图形字符集(n>1)应是94n字符集或96n字符集。通过转义字符ESC加上一些参数构成转义序列来指明调用GB 2312汉字字符集,再通过移位功能调用GB 2312中的各个94字符集。(在这94个字符集中,每个汉字字符和非汉字字符各占一个字位,这就是"区位"的由来)。
GB2312规定的汉字为常用汉字,包括简化汉字三千余个。由于我国汉字数量巨大(约10万字),我国又陆续增加了六个辅助集。其中,基本集与第二、第四辅助集是简化汉字集,第一(即GB 12345)、第三、第五辅助集是繁体集,且基本集与第一、第二与第三、第四与第五辅助集分别有简、繁体字一一对应关系,(个别简、繁关系为一对多的汉字除外)。第七辅助集汉字的来源是GB13000.1的CJK统一汉字部分,为日本、韩国和台湾地区使用的汉字。七个字符集包含汉字共计约49,000字(简化字和繁体字分别编码)。
GB2312 GB 2312-80《信息交换用汉字编码字符集 基本集》在ISO/IEC 2022编码空间位置图