|
"津云"客户端 |
|||
貌不惊人“的”使用频率最高
“氾仝甯”等怎么进的8300
酝酿多年的《通用规范汉字表》终于对外公示。
为什么要制定字表?字表中的汉字是如何筛选出来的?怎样规范地使用汉字?围绕这些问题,本报记者对主要设在北京师范大学的《通用规范汉字表》后期研制工作组进行了独家专访,揭开字表中8300个通用规范汉字背后的“秘密”。
八年甄选8300个汉字此次公示的《通用规范汉字表》,一共收录了8300个汉字,共分为三级。
早在1988年,我国便出台了《现代汉语通用字表》(收字7000个)和《现代汉语常用字表》(收字3500个);时隔21年之后,为何要重新制定《通用规范汉字表》?对此北京师范大学文学院王立军教授表示,这主要是因为在信息化时代之下,人们的语言生活发生了巨大变化。
“任何规范都只适用于特定的时期,需要随着时代的发展而进行改革。”王立军教授解释说,原有的规范在当时指导人们用字发挥了重要的作用,但是由于当时的技术局限性,规范中也有一些疏漏,比如个别进入常用字的字通行度不高。另外,不同部门先后发布的规范,内容上并不完全一致,需要重新进行整合和优化。
《通用规范汉字表》研制项目从2001年启动,历时8年才得以完成。专家学者们已经充分研究了我国自1955年以来编制的多个原有字表的规范原则,并基本清理了历史遗留的用字规范问题。值得一提的是,此次发布的字表作为规范标准,是在《中华人民共和国通用语言文字法》发布后所制定的,它具有法律效应。
字表发布后并非一劳永逸。王立军教授表示,研制工作组已经考虑到了今后对字表进行修订的计划。按照目前的设想,有关部门今后将对字表“三年一小修,十年一大修”,根据字表的实际使用情况和社会需求的变化,适时地对字表进行微调。
每个规范字都有来历能够入选一、二级字表的汉字,是根据其使用频率来确定的。专家们采用了9个信息庞大的“语料库”的数据进行了统计。据北师大文学院讲师卜师霞介绍,最为主要的两个语料库是“国家语委现代汉语平衡语料库”和“北京语言大学现代新闻媒体动态流通语料库”,收录的汉字量分别为9100万和3.5亿。
“仅现代汉语平衡语料库中,不重复的汉字就有8181个。”卜师霞老师介绍说,这个语料库中涵盖了从1919年至2002年的大量文字资料,除了报刊书籍、政府公文等印刷物和出版品外,就连并不起眼的产品说明书和广告中的用字情况,也都一并囊括其中。
使用频率最高的汉字究竟是哪个字?在对语料库进行统计时,专家学者们也掌握到了这个并不为人所知的有趣细节。教育部语言文字应用所的王晓明老师经过统计后发现,貌不惊人的“的”字在汉字中使用频率最高,在语料库中出现的次数,竟然高达169万多次。
“《通用规范汉字表》中收录的每个字,都有明确的来历。”北师大文学院讲师凌丽君说,汉字中有大量的异体字存在,为了确保字表中收录汉字的规范性,研制工作组的专家学者们对每个汉字的出处、正异对应关系都进行了检索和考证,为此甚至查遍了包括《四库全书》在内的典籍文献。