西北工业大学医院招聘:印书印报得用多少个字

来源:百度文库 编辑:九乡新闻网 时间:2024/05/05 22:53:49

   印书印报得用多少个字

 

一天的《人民日报》8个版,约七、八万字。一部《毛泽东选集》5卷宗100万余字。这成千上万的书报刊物,都是用多少个不同样儿的汉字印出来的呢?

回答这样的问题,不能任意瞎说,也不能靠估计,得进行实际的核查统计。这种工作叫作查频统计。“频”就是“频度”,也就是每一个字在各种书报刊物上出现的次数。查频的结果,可以知道哪些字常用,哪些字不常用。对于白话文书报用字的查频统计,五十多年前就由陈鹤琴先生开始进行了。他统计了55万多个字的书报,编出一本《语体文应用字汇》。以后还有别的人进行过好几次统计。可是查频统计规模最大,所统计各类书报刊物字数最多的,要算是1975年—1976年在国家出版局及四机部、科学院、新华社、文改会等领导下,由北京新华印刷厂、人民日报印刷厂等的排字工人,带领着北京市1,500名中学生进行的一次。这一次调查了政治理论、新闻通讯、科学技术、文学艺术4类的书86本、期刊104本、文章7,075篇共计划性21,629,372字。统计的结果,1977年由新华印刷厂编印了《汉字频度表》。1978年我和高景成等几位同志,把该表上的字登记在卡片上,经过反复核对,编出了《按字音查汉字频度表》。这本资料上的字,照字音按汉语拼音字母的顺序排列。要想查到任一个字的出现次数、常用级别和原编号,都非常方便。

经过这次查频统计和核对,我们可以看到现代汉字应用上的一些非常有趣的情况。首先,题目上所问的问题可以回答了:印现代书报刊物一共只用到6,335字。这六千多字按其出现次数可以分为5级。最常用字只有560个字。这些字中,多的反复出现几十万次(如:的,1号字,830,322次),少的也出现七、八千次。它们的出现次数合计起来,占总字次数2,162万多的80%以上。尤其是其中最常用的42个字(的一是在了不和有大这主中人上为们地个用工时要动国产以我到他会作来分生对于学下级义就年),竟占一般书报刊物用字的1/4!

这560个字加上常用字807个,次常用字1,033个,合共2,400个。这2,400个比较常用的汉字的出现次数累计起来,占到总字次数的99%以上。这个数字的含义,就是说一个人如果认识2,400字,一般白话书报刊物上的字,99%他都认得。

这样一说,汉字岂不也算容易了吗?不,汉字的多和难,正在那1%里头。请看:不常用字1,770个,它的出现次数加起来也只占总字次数的0.04%;偶用字,就是在两千多万字只出现一两次,顶多不超过20次的那些字2,165个,占总字次数的0.06%。所占比例虽小,但是不常用字并不是不用字;偶用字有时也还要用。特别是如果出现在一篇文章或一个词语的关键部位,不认识它就是看不懂。

从这次查频统计来看,现代书报刊物上用的汉字数目还是过多,需要进一步加以整理和精简。