萨尔浒之战双方伤亡:字库小知识_☆~99.ever

来源:百度文库 编辑:九乡新闻网 时间:2024/05/17 07:49:32

最近常见有人对GB、GBK、GB18030、Unicode等编码概念不清,再掺杂上Ext-A、Ext-B、Ext-C等,更混乱了。所以特别整理一些知识贴出来给大家:     

     GB、BIG5、GBK、GB18030、Unicode     

     GB2312:早期的,为了处理汉字,程序员设计了用于简体中文的GB2312,即国家标准字集,中华人民共和国国家标准汉字信息交换用编码,是一个由中华人民共和国国家标准总局发布的关于简化汉字的编码,通行于中国大陆地区及新加坡,简称GB码或国标码。共定义6763个汉字和682个其它符号。     

     BIG5字集:台湾繁体字集,共包括国标繁体汉字13053个。     

     GBK (俗称大字符集):该编码标准共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。如果你的输入法有什么常用的人名等打不出,就可以试试使用GBK字库。     

     GB18030:国家制定的一个强制性大字集标准,全称为GB18030-2000,凡在中国大陆销售的国内外中文电脑,都必须能够处理27533个汉字,否则将不准销售。它的推出使我国港台地区及其他国家使用的汉字集有了一个"大一统"的标准。      

     Unicode :也是一种字符编码方法,不过它是由国际组织设计,可以容纳全世界所有语言文字的编码方案。Unicode的学名是"Universal Multiple-Octet Coded Character Set",简称为UCS。可输出国际超大字集全部70000多个中日韩汉字及20000多个不同种类的字母与符号(需安装超大字集支持包)     

     所以从汉字包含来看,简单地可以说:     
                GB2312=ASCII+常用汉字+符号     
                GBK=GB2312+不常用字(含BIG5繁体汉字)+图形符号     
                GB18030=GBK+Ext-A+图形符号     
                Unicode=GB18030+Ext-B+……(如未发布的Ext-C及其它国家文字)