• 工作总结
  • 工作计划
  • 心得体会
  • 述职报告
  • 事迹材料
  • 申请书
  • 作文大全
  • 读后感
  • 调查报告
  • 励志歌曲
  • 请假条
  • 创先争优
  • 毕业实习
  • 财神节
  • 高中主题
  • 小学一年
  • 名人名言
  • 财务工作
  • 小说/有
  • 承揽合同
  • 寒假计划
  • 外贸信函
  • 励志电影
  • 个人写作
  • 其它相关
  • 生活常识
  • 安全稳定
  • 心情短语
  • 爱情短信
  • 工会工作
  • 小学五年
  • 金融类工
  • 搞笑短信
  • 医务工作
  • 党团工作
  • 党校学习
  • 学习体会
  • 下半年工
  • 买卖合同
  • qq空间
  • 食品广告
  • 办公室工
  • 保险合同
  • 儿童英语
  • 软件下载
  • 广告合同
  • 服装广告
  • 学生会工
  • 文明礼仪
  • 农村工作
  • 人大政协
  • 创意广告
  • 您现在的位置:六七范文网 > 其它相关 > 正文

    从当前汉字使用情况调查看《现代汉语常用字表》①

    来源:六七范文网 时间:2023-05-09 14:10:25 点击:

    张艳梅,吕 展

    (1.武汉工程大学外语学院,湖北,武汉 430205;
    2.暨南大学华文学院,广东,广州 510610)

    《现代汉语常用字表》是由国家语言文字工作委员会和国家教育委员会1988年1月26日联合发布的,选字范围从1928年至1986年,根据汉字在不同学科的分布和使用度,以汉字的使用频率为主,也考虑了汉字的构字能力和构词能力等因素等,最后共收录了3500个汉字,包括常用字2500个,次常用字1000个。

    2001年起,教育部、国家语委启动了《通用规范汉字表》研制工作,至2013年正式发布。《通用规范汉字表》一级字表列出3500个常用汉字,在功能上替代《现代汉语常用字表》,旨在满足基础教育和文化普及层面的用字需要;
    二级字表,是使用频度仅次于一级字表,主要满足出版印刷、辞书编纂和信息处理等方面的一般用字需要;
    三级字表是对那些与人们日常生活密切相关的专门领域用字的补充。

    目前已有的相关汉字用字调查,较少从精简汉字的角度去思考汉字改革中尚待解决的遗留问题。为便于代代新人的学习和汉字更好地走向世界,是否应该把34年前发布的《现代汉语常用字表》和近10年前发布的《通用规范汉字表》的3500个常用字表作一番检验?使它更加切合当代汉字的使用现状,也更加有利于当下语文教育的提高和语文应用的规范,使语文工作为语文生活和信息处理做出更大的贡献。

    为了调查当前最新的汉字使用现状,本文运用语料库语言学、计量语言学的方法,采用Python爬取2021年《人民日报》与《光明日报》两份报纸全年的新闻正文语料,建立语料库,对其用字情况进行调查分析,并进一步统计分析2011年至2021年《中国语言生活状况报告》(绿皮书)10余年《年度媒体用字总表》的汉字使用情况,得出1988年发布的《现代汉语常用字表》以及2013年发布的《通用规范汉字表》一级字表3500常用字数量需要精简、字种需要更新、分级需要细化等结论。在此基础上,根据字频、覆盖率、共用字等统计分析,建议设置2500常用字数量并进一步细化分级。

    2.1 语料说明

    (1)2021年《人民日报》与《光明日报》两份报纸全年的新闻正文语料,采用Python爬取人民网(http://paper.people.com.cn)和光明数字报网(https://epaper.gmw.cn)语料,语料的分析不涉及图文、广告版块、作者姓名等信息的用字情况。语料总字符次为67183474,汉字总字次为56037692,汉字字种数为7102。其中,《人民日报》部分的语料字符次为33046962,汉字总字次为27641211,汉字字种数为5791。《光明日报》部分的语料字符次为34136512,汉字总字次为28396481,汉字字种数为6931。

    (2)自2005年教育部国家语委、国家语言资源监测中心连续发布《中国语言生活状况报告》(绿皮书)至今已有17年。其中,自2011年起每年都会根据上一年的媒体用字情况,将所有用字按照使用频次由高到低排列形成《年度媒体用字总表》,对上一年的年度媒体用字情况进行监控与总结。语料来自于各年度国家语言资源监测语料库,包括平面、有声、网络三种媒体。平面媒体来源于《人民日报》《光明日报》等国内影响较大的15家报纸的年度全部文本;
    有声媒体语料来源于电视台、广播电台及融媒体栏目的节目转写文本;
    网络媒体语料来自新浪、腾讯的新闻网页。在此基础上,我们进行计量分析,统计得出2010年至2020年10余年年度媒体总表的汉字总字次为10940610401,字种数为17055;
    各年度所用字种中均有大量频次低于10的低频字,即各年度媒体所用字种数中都有相当大一部分的低频字、罕见字,即人们实际使用的中、高频字种数并不多。

    2.2 调查内容

    调查对象为2021年《人民日报》与《光明日报》正文中的汉字,以及2011年至2021年《中国语言生活状况报告》的10余年《年度媒体用字总表》的汉字。调查项目有 “字种、字种数、频次、频率、覆盖率”等。

    “字种”指所调查语料中字形不同的汉字;

    “字种数”指所调查语料中字形不同的汉字个数;

    “频次”指调查对象在调查语料中出现的次数;

    “频率”指调查对象的频次与整个语料所含调查对象总频次的比值;

    “覆盖率”指被调查语料内指定调查对象占所有调查对象总量的百分比,其计算方法同 “累加频率”①参见国家语言资源监测与研究中心《中国语言生活状况报告》(2013)中《语言资源监测相关术语》,北京:商务印书馆。。

    2.3 调查方法

    本文通过Python语言构建爬虫系统,将所需要的新闻文本语料爬取保存至本地,并建立语料库。统计工具主要采用教育部语言文字应用研究所计算语言学研究室开发的字词频率统计工具(Corpus Word Frequency),以及暨南大学刘华教授开发的 “汉语助研”软件,同时也采用Excel等相关可视化及批量数据统计工具。

    2.4 调查结果分析

    2.4.1 2021年《人民日报》与《光明日报》用字情况调查结果

    (1)2021年《人民日报》与《光明日报》字种使用情况的调查分析

    1)2021年《人民日报》与《光明日报》每月字种数使用情况

    2021年《人民日报》与《光明日报》全部语料字符次为67183474,汉字总字次为56037692,汉字字种数为7102,所有用字按照使用频次由高到低排列形成2021年两报用字总表。其中,《人民日报》部分的语料字符次为33046962,汉字总字次为27641211,汉字字种数为5791;
    《光明日报》部分的语料字符次为34146512,汉字总字次为28396481,汉字字种数为6931。本文对2021年《人民日报》与《光明日报》中每一个月所用的字种数进行了分析,如图1所示。

    通过图1,可以发现《人民日报》和《光明日报》每月所用的字种数大体上都比较均匀。尤其是《人民日报》,每月所用字种数在4222~4481之间波动,波动数值不大,月均所用字种数约为4298。《光明日报》整体而言所用字种数比人民日报要多一些,每月所用字种数在4553~5012之间波动,波动数值相对《人民日报》要大一些,月均所用字种数约为4864。

    2)2021年12月《人民日报》与《光明日报》每日字种数使用情况

    以2021年12月《人民日报》与《光明日报》的语料为调查对象,分析这一个月中两报每日所用的字种数,来观察具体每一天的用字情况。

    2021年12月《人民日报》的语料中,字符次为2972787,汉字总字次为2510272,汉字字种数为4268,具体天数所用字种数情况如图2所示。

    据图2,可以看出2021年12月《人民日报》每天所用的字种数并不多。例如12月4日,所用字种数为当月最少,1683个字种;
    12月22日所用字种数最多,2651个字种。整体上来看,每日所用的字种数在1683-2651之间波动,平均数约为2245,距离《通用规范汉字表》一级字表中3500常用字的数值差距较大。

    图1:2021年1月至12月《人民日报》与《光明日报》字种数使用情况

    图2:2021年12月《人民日报》字种数使用情况

    2021年12月《光明日报》的语料中,字符次为2900088,汉字总字次为2466181,汉字字种数为4919,具体天数所用字种数情况如图3所示。

    图3:2021年12月《光明日报》字种数使用情况

    据图3可以看出2021年12月《光明日报》每天所用的字种数相对于《人民日报》而言稍多一些,整体上在2074~2765之前波动。但每天所用的字种数仍不多,大多为2500左右,相对于《通用规范汉字表》一级字表中3500常用字的数值仍有一段距离。

    其次,对于2021年12月《光明日报》所用字种数最多的12月31日进行单独分析,此日所用字种中不同频次范围的字种数如表1所示。

    表1:2021年12月31日《光明日报》不同频次范围的字种数

    据表1,12月31日《光明日报》使用频次为1的字种有568之多,约占当天总字种数2765的20%;
    使用频次在2到10之间的字种数为1135,约占当天总字种数的41%;
    使用频次在11到50之间的字种数为649,约占当天总字种数的23%;
    使用频次大于50的字种数为413,仅占这一天总字种数2765的15%左右。据此可以发现,即使是2021年12月《光明日报》中使用字种数最多的一天,也有大量的字种出现频率较低,实际上所用频率较高的字种并不多。

    (2)2021年《人民日报》与《光明日报》汉字覆盖率与字种数的调查分析

    表2显示了2021年《人民日报》与《光明日报》语料中汉字覆盖率与字种数之间的关系:238个字种可以覆盖语料的60%,占总字种数的3.35%;
    508个字种可以覆盖语料的80%,占总字种数的7.15%;
    829个字种可以覆盖语料的90%,占总字种数的11.67%;
    2217个字种(占总字种数的31.20%)可以覆盖语料的99%,剩下的1%覆盖率则需要另外4885个字种来覆盖。由此可见,人们日常使用的高频汉字并不多,少数的高频字便可以覆盖大部分的语料,基本满足语言文字使用需求,剩下的极小部分语料则需要大量的低频字来补充。

    表2:2021年《人民日报》与《光明日报》汉字覆盖率-字种数统计

    (3)2021年《人民日报》与《光明日报》各频次段字种数的调查

    为了了解2021年《人民日报》与《光明日报》各频次段用字情况,本文对不同频次范围的字种数进行分析,如表3所示。

    表3:2021年《人民日报》与《光明日报》不同频次范围的字种数

    据表3,使用频次在100以下的字种数为3415,约占总字种数7102的48%;
    使用频次在100到1000之间的字种数为1578,约占总字种数的22%;
    使用频次在1001到10000之间的字种数为1232,约占总字种数的17%;
    使用频次在10000以上的字种数为877,约占总字种数的12%。使用频次在1000以上的字种数为2109(约占总字种数的29%),据表2可知2217个字种可覆盖语料的99%,因此这2109个字也可以覆盖大部分语料,进一步说明人们日常所需的高频字种数量不多。

    (4)2021年《人民日报》与《光明日报》用字与《通用规范汉字表》一级字表(3500常用字)的比较

    通过上文的2021年《人民日报》与《光明日报》用字情况调查,可以发现日常所需的高频常用汉字数目其实并不多,《现代汉语常用字表》与《通用规范汉字表》所设置的常用字数(3500)应该可以精简。

    本文将《通用规范汉字表》一级字表(3500常用字)与2021年两报用字总表中使用频率在前3500的字种进行对比,发现3500一级字表中有412个字不在2021年两报用字总表中的使用频率前3500。也就是说,在当前的报刊媒体语言生活中,从2021年《人民日报》与《光明日报》用字情况看,这412个字使用频率较低。

    2.4.2 2021年两报用字总表与绿皮书10余年《年度媒体用字总表》的比较

    考虑到所选取的2021《人民日报》与《光明日报》语料量尽管已比较大,但可能仍有一定局限性,因此,本文进一步将以上《通用规范汉字表》一级字表独用的412个字与教育部国家语委、国家语言资源监测中心发布的《中国语言生活状况报告》(简称 “绿皮书”)10余年《年度媒体用字总表》①按:绿皮书由教育部国家语委、国家语言资源监测中心发布,2011年之后每年附上的都是上一年度《年度媒体用字总表》,对上一年的年度媒体用字情况进行监控与总结。即:《中国语言生活状况报告2011》中附上的是《2010年度媒体用字总表》,《中国语言生活状况报告2012》中附上的是《2011年度媒体用字总表》,其余依次类推。对比。将绿皮书10余年《年度媒体用字总表》中每一年使用频率前4000的字种进行统计排序,共获得4362个字种以及这些字种在这10余年《年度媒体用字总表》中总的使用频次和总文本数;
    在此基础上,将所有字种按照使用频次由高到低排列形成10余年媒体用字汇总表。然后,检索上文提到的412个独用字在10余年媒体用字汇总表中的的频位①指某调查对象在频次、频率或频级中的排位。参见国家语言资源监测与研究中心《中国语言生活状况报告》(2013)中的《语言监测相关术语》,北京:商务印书馆,2013。和出现频次。结果证明,其与上文2021年《人民日报》与《光明日报》用字情况调查的统计结果是大体相符的,这412个字中约有82.76%的字使用频率较低,并不位于10余年媒体用字汇总表使用频率前3500。

    (1)十余年绿皮书《年度媒体用字总表》汉字覆盖率与字种数汇总分析

    在以上基础上,本文进一步深入统计分析2011年至2021年《中国语言生活状况报告》(绿皮书)10余年《年度媒体用字总表》的汉字使用情况。这10余年语料字种数与覆盖率关系总表,如表4所示:

    表4:2010年至2020年绿皮书《年度媒体用字总表》汉字覆盖率与字种数统计

    据表4可知,当覆盖率达10%至80%时,2010年至2020年年度媒体用字的覆盖率与字种数关系较为稳定,各年所用的高频字种数相差不大。当覆盖率为10%时,2010年至2020年所用字种数在9至12之间波动;
    当覆盖率为80%时,2010年至2020年所用字种数在557至601之间波动。当覆盖率达90%之后,随着覆盖率的增加,各年对应使用的字种数数值相差逐渐变大。但总体而言,当覆盖率为某一特定数值时,各年所使用的字种数相差不是很大,尤其是高频字种数较为稳定。

    (2)十余年绿皮书《年度媒体用字总表》覆盖率达10%至90%、99%时的共用字种分析

    本文进而对各年度媒体用字的覆盖率达10%至90%以及99%时所使用的字种进行了具体分析,发现存在很多共用字,如表5所示:

    据表5可知,绿皮书10余年《年度媒体用字总表》中的高频汉字亦非常稳定、集中,存在大量的高频共用字,当覆盖率为80%时,各年共用字种数为500;
    当覆盖率为90%时,各年共用字种数为812;
    当覆盖率为99%时,各年共用字种数为2152。这些最常用字效用稳定,文本覆盖率高,是大众10余年媒体语言生活中所使用的最高频字。2152的数量不及一般认为的3500常用字。

    表5:2010年至2020年绿皮书《年度媒体用字总表》各覆盖率段共用字种数统计

    (3)2021年两报用字总表与绿皮书2019年、2020年《年度媒体用字总表》的汉字覆盖率和字种数比较

    将2021年两报用字总表的用字覆盖率和字种数情况与绿皮书近两年的用字覆盖率与字种数情况相比较,如表6所示:

    表6:2021年两报用字总表与绿皮书2019年、2020年《年度媒体用字总表》的汉字覆盖率-字种数比较

    据表6可知,由于2021年两报用字总表的语料规模比绿皮书2019年、2020年《年度媒体用字总表》的语料规模小,三者在所用字种数上差别较大,但当覆盖率为80%时,三者的所用字种数比例差别较小,分别是5.00%、5.08%、7.15%,标准差为0.99。因此,可以发现高频汉字对文本的覆盖能力十分稳定,无论是在小规模语料还是在大规模语料中的使用频率都很高;
    另一方面,也显示出本文所得出的2021年两报用字总表的汉字覆盖率与字种数情况比较贴合绿皮书2019年、2020年《年度媒体用字总表》的用字覆盖率与字种数情况,符合语言文字使用事实。

    表7:周有光先生《现代汉字学发凡》中总结的汉字出现频度不平衡规律

    2.5 汉字效用递减率与本文的调查统计结果比较

    1980年周有光先生在《现代汉字学发凡》一文中总结出了汉字出现频度的不平衡规律,大致如表7所示。

    其后,周有光先生多次强调指出 “汉字的使用效率是很不平衡的。各家的频率统计互有出入。斟酌于各家之间,得到如下的规律:最高频1000字的覆盖率大约是90%,以后每增加1400字大约提高覆盖率十分之一。这叫做‘汉字效用递减率’。”苏培成先生《现代汉字学纲要》中进一步总结, “根据‘汉字效用递减率’,2400个字种覆盖率为99%,这可以作为常用字和最常用字的字量。”这和本文当代汉字社会应用的实际情况调查结果,即2021年《人民日报》与《光明日报》的用字情况统计分析结果、《中国语言生活状况报告》(绿皮书)2011~2021共10余年年度媒体用字汇总表统计分析结果是相符的。这说明,1988年发布的《现代汉语常用字表》和2013年发布的《通用规范汉字表》一级字表的3500常用字,数量需要精简,分级亦需细化。

    根据本文上文的字频、覆盖率、共用字等统计分析,或可将现代汉字的常用字限定于2500个之内并进一步细化分级。

    “最高频1000字的覆盖率大约是90%”,2500个字之内或许还可切一条线:对于初学者(如小学到初中、外国人学中文),入门的1000字,亦或800-1000字作为其常用字或许就够了。为更好、更直观地说明此处 “2500个之内”和入门级 “800~1000字左右”,本文将上文2021年《人民日报》与《光明日报》的用字情况统计分析结果绘制成散点图如图4所示:

    图4:2021年两报用字总表覆盖率和字种数调查的散点图

    表8:《2010年度媒体用字总表》汉字覆盖率与字种数统计

    图5:《2010年度媒体用字总表》汉字覆盖率与字种数提升曲线

    为更深入地讨论 “建议把现代汉字的常用字限定于2500个之内”和入门级 “800~1000字左右”,本文进一步将上文对《中国语言生活状况报告》(绿皮书)2011~2021共10余年《年度媒体用字总表》二度统计后的字频、覆盖率、共用字等统计数据进行列表,并绘制成散点图如下:

    (1)《2010年度媒体用字总表》中汉字覆盖率与字种数之间的关系:详见表8和图5。

    (2)《2011年度媒体用字总表》中汉字覆盖率与字种数之间的关系:详见表9和图6。

    (3)《2012年度媒体用字总表》中汉字覆盖率与字种数之间的关系:详见表10和图7。

    (4)《2013年度媒体用字总表》中汉字覆盖率与字种数之间的关系:详见表11和图8。

    (5)《2014年度媒体用字总表》中汉字覆盖率与字种数之间的关系:详见表12和图9。

    (6)《2015年度媒体用字总表》中汉字覆盖率与字种数之间的关系:详见表13和图10。

    (7)《2016年度媒体用字总表》中汉字覆盖率与字种数之间的关系:详见表14和图11。

    (8)《2017年度媒体用字总表》中汉字覆盖率与字种数之间的关系:详见表15和图12。

    (9)《2018年度媒体用字总表》中汉字覆盖率与字种数之间的关系:详见表16和图13。

    (10)《2019年度媒体用字总表》中汉字覆盖率与字种数之间的关系:详见表17和图14。

    (11)《2020年度媒体用字总表》中汉字覆盖率与字种数之间的关系:详见表18和图15。

    周有光先生在《21世纪的华语和华文》中指出 “现代通用汉字有7000个,其中半数3500个是常用字。按照‘汉字效用递减率’,最高频1000字的覆盖率是90%,以后每增加1400字提高覆盖率十分之一。利用常用字,淘汰罕用字,符合汉字规律。与其学多而不能用,不如学少而能用。21世纪将出现一种‘千字文’加‘拼音’的‘基础华语’,作为学习华语的入门教材。‘基础华语’对外国人学习华语最为有用。在21世纪的后期,讲究效率的华人将把一般出版物限制在3500常用字范围之内①按:此处周有光先生提到的 “把一般出版物限制在3500常用字范围之内”与《通用规范汉字表》一级字表收字3500个常用汉字不是一回事:《通用规范汉字表》满足出版印刷等方面的一般用字需要,是一、二级字表的6500字。具体来说,2013年正式发布的《通用规范汉字表》收字8105个,分为三级。一级字表即前文所说的3500个常用汉字,在功能上替代《现代汉语常用字表》,旨在满足基础教育和文化普及层面的用字需要。二级字表3000字,使用频度仅次于一级字表,主要满足出版印刷、辞书编纂和信息处理等方面的一般用字需要;
    一、二级字表的6500字,其作用相当于原1965年发布的、收字7000个、基本满足当时出版印刷要求的《现代汉语通用字表》。三级字表1605字,是姓氏人名、地名、科学技术术语和中小学语文教材文言文用字中未进入一、二级字表,但在特定领域中较为通用的字,是对那些与人们日常生活密切相关的专门领域用字的补充。,实行字有定量,辅以拼音。”本文重点讨论的正是周有光先生此处提到的 “字有定量”问题(关于精简汉字的方向和 “辅以拼音”的调查研究,我们将另文撰述)。

    本文从当代汉字使用现状、社会汉字使用情况调查来思考精简汉字数量的问题。结论如下:

    表9:《2011年度媒体用字总表》汉字覆盖率与字种数统计

    图6:《2011年度媒体用字总表》汉字覆盖率与字种数提升曲线

    表10:《2012年度媒体用字总表》汉字覆盖率与字种数统计

    图7:《2012年度媒体用字总表》汉字覆盖率与字种数提升曲线

    3.1 精减常用字表的数量

    根据2021年《人民日报》与《光明日报》的用字情况调查,发现其日常用字的字种数并不算多,829个字便可覆盖2021年《人民日报》与《光明日报》90%的语料,2217个字可覆盖2021年《人民日报》与《光明日报》99%的语料,距离《通用规范汉字表》一级字表所设置的3500常用字数量有一定距离。因此,本文主张精简常用字表的数量至2500字:两报分析中,2500字能覆盖语料的99.34%,能基本满足人们的语言文字使用需求。

    2011年至2021年绿皮书《年度媒体用字总表》反映的情况同样如此:所使用的高频字数量并不多。当覆盖率为90%时,2010年至2020年所用字种数在877至972之间波动,共用字种数为812,即不到1000字的高频字种可以覆盖当年媒体用字语料的90%;
    当覆盖率为99%时,2010年至2020年所用字种数在2247至2449之间波动,共用字种数为2152,数量远不及一般认为的3500常用字数。

    表11:《2013年度媒体用字总表》汉字覆盖率与字种数统计

    图8:《2013年度媒体用字总表》汉字覆盖率与字种数提升曲线

    表12:《2014年度媒体用字总表》汉字覆盖率与字种数统计

    表13:《2015年度媒体用字总表》汉字覆盖率与字种数统计

    3.2 更新常用字表的字种

    随着时代的发展,1988年发布的《现代汉语常用字表》中的某些常用字在人们当前语言生活中使用频率较低,如今算不上常用字了;
    《通用规范汉字表》一级字表(3500常用字)中有412个字位于《2021年两报用字总表》使用频率的3500之后。尽管《通用规范汉字表》一级字表仅对《现代汉语常用字表》更新了103个字,但剩下的3397个字从1988年沿用至今,更新的字种数量不多,占比不大。将《通用规范汉字表》一级字表与绿皮书10余年媒体用字总表使用频次位于前3500的字种比较,亦发现《通用规范汉字表》一级字表中341字并不位于10余年媒体用字总表使用频次的前3500。因此,本文认为仍有一部分字种需要更新,以更好地符合当前语言生活实际。

    图10:《2015年度媒体用字总表》汉字覆盖率与字种数提升曲线

    表14:《2016年度媒体用字总表》汉字覆盖率与字种数统计

    图11:《2016年度媒体用字总表》汉字覆盖率与字种数提升曲线

    3.3 细化常用字表的分级

    根据2021年两报用字总表与10余年媒体用字总表的汉字覆盖率和字种数情况可以发现,不同频次汉字的效用不同,汉字效用随着使用频率的增加而增大。《现代汉语常用字表》对于常用字的分级, “常用”和 “次常用”的二级划分较笼统,各频次汉字之间的使用频率差别不明显。因此,主张进一步划分现代汉语常用汉字的常用等级,把现代汉字的常用字限定于2500个之内并进一步细化分级;
    同时,对于初学者(如小学到初中、外国人学中文),2500个字之内,或可再切一条800~1000字的线作为其常用字。

    表15:《2017年度媒体用字总表》汉字覆盖率与字种数统计

    综上,本文运用语料库语言学、计量语言学的方法,采用Python爬取语料,统计分析2021年《人民日报》与《光明日报》的用字情况,并和教育部国家语委、国家语言资源监测中心发布的《中国语言生活状况报告》(绿皮书)2011~2021共10余年《年度媒体用字总表》作比较,用当代汉字社会应用的实际情况说明,1988年发布的《现代汉语常用字表》和2013年发布的《通用规范汉字表》一级字表的3500常用字,数量需要精简、字种需要更新、分级需要细化。在此基础上,根据字频、覆盖率、共用字等统计分析,建议把现代汉字的常用字限定于2500个之内并进一步细化分级。

    图12:《2017年度媒体用字总表》覆盖率与字种数提升曲线

    表16:《2018年度媒体用字总表》汉字覆盖率与字种数统计

    图13:《2018年度媒体用字总表》覆盖率与字种数提升曲线

    图14:《2019年度媒体用字总表》汉字覆盖率与字种数提升曲线

    表17:《2019年度媒体用字总表》汉字覆盖率与字种数统计

    表18:《2020年度媒体用字总表》汉字覆盖率与字种数统计

    精简汉字数量是当前汉字改革的主要矛盾,但至今没有引起人们足够的重视。本研究可谓是接过前人的接力棒,积极开展汉字用字调查和计量分析,所用的调查方法和得出的相关结论,或可为将来《通用规范汉字表》的修订、为基础教育(含中小学语文基础教育教材和对外汉语教材编写用字)和文化普及的基本用字修订等提供一定的参考,为语文生活、语文教育和信息处理贡献我们微薄的力量。

    图15:《2020年度媒体用字总表》汉字覆盖率与字种数提升曲线

    猜你喜欢 常用字用字光明日报 容易混淆的词语国际医药卫生导报(2022年5期)2022-03-18《汉语大字典》“人名用字”考误举隅汉字汉语研究(2021年1期)2021-06-11科技论文表格的编排要求(五):用线和用字蚌埠医学院学报(2020年1期)2020-12-11关于常用字覆盖率统计算法的研究计算机技术与发展(2020年5期)2020-05-22深情寄语殷殷祝福新天地(2019年6期)2019-06-21译经用字与译经词语新释汉字汉语研究(2019年1期)2019-05-21《光明日报》和@光明日报2017年全国两会报道对比分析新媒体研究(2017年12期)2017-07-29谈常用字词的选取及其等级划分辞书研究(2014年2期)2015-05-11光明日报《留学》杂志—跨国采访实战营留学(2014年21期)2014-05-03常用字辨正——“己-巳-已”语文世界(教师版)(2005年1期)2005-03-18

    推荐访问:汉字 现代汉语 常用