读《新编甲骨文字形总表》兼论甲骨文字形检索系统的完善

摘要《新编甲骨文字形总表》是甲骨文字形系统整理研究的最新成果，但在古文字数字化新环境中，它所代表的为适应传统文本形式检索要求而形成的甲骨文检索系统不但原有缺陷被放大，而且显现出若干新的问题。在部首设置方面，《总表》的部首单位数量相对甲骨文构形系统的实际而显得数量偏少，导致了部首与所辖字对应的模糊性和人为性；将部首限定在独体范围内则降低了某些部首与其所统摄字形结构的契合度；忽略与后世通用部首的对应性，增加了甲骨文部首与使用者的隔膜度。在字形归部方面，由“异体相连”而造成的他部字带入从根本上违背了部首检字原则；部分字形纯形式化归部破坏了整个系统的文字学部首性质。在字形排序方面，多重排序标准造成部首内字形排列失序。以上种种问题表明，甲骨文检索系统的改进必须以进一步贴近甲骨文文字系统的实际、坚持排序标准的一元化、发挥数字化的超文本多路径优势为原则。

关键词甲骨文新编甲骨文字形总表古文字数字化

《新编甲骨文字形总表》(沈建华、曹锦炎编，香港中文大学出版社2001年出版。以下简称《总表》)是甲骨文字形系统整理研究的最新成果，它的成绩表现为如下几个方面：首先是基础工作扎实。据该书绪论所述，编者对《殷墟甲骨刻辞类纂》(姚孝遂主编，中华书局1989年1月版，以下简称《类纂》)“重新作了一次整体性的核校和整理”，对《类纂》部首和字目有明显错误的地方作了“合理性的调整、增补、归并”。《总表》共设152部，收录甲骨字形6051个。修正了约200个《类纂》误摹的字形，取消了146个《类纂》误摹的字形和个别重复收字，同时也增收了《类纂》遗漏未收字800个左右。此外，《总表》还隶定了部分《类纂》中未能隶定的字，对于《类纂》中未能释读而散入各部的异体字则根据文例调整或确立了正确的归部，从而“为纷繁复杂之甲骨文字建立起了一套系统定形的排列体系”。其次是材料覆盖面大。《总表》的材料依据除《甲骨文合集》外，还涵盖了其后的《小屯南地甲骨》、《东京大学东洋文化研究所藏甲骨文字》、《英国所藏甲骨集》、《天理大学附属天理参考馆藏品甲骨文字》等多种较新的甲骨文著录。再次，手段比较先进。据编纂者所述，该书的编写有一个数字化平台作基础，而甲骨文字的计算机输入亦较大限度地保证了“数据类聚的完整和效果统一”。

《总表》的问世，恰恰赶在了一个古文字数字化具有突破性进展的当口［1］，因而在客观上，它将历史地成为这个进程中发挥重要作用的文献资料。然而在古文字数字化不断进展的新环境中，为适应传统文本形式检索要求而形成的现行甲骨文工具书都不免要受到数字化模式的重新审视，不但其原有缺陷会更加凸现，而且还不免显现出若干新的问题。客观地说，《总表》虽然也在编纂中采用了某些数字化的手段，但就总体而言仍属于传统的甲骨文工具书系列，而其最新成果的地位，更决定了它不能不成为数字化视角审视的首当其冲的对象。下文对《总表》的检索系统的研讨，正是基于这样一个前提来进行的。需要作两点说明：第一，因为是立足于前文已经说明的研讨视角，以下对《总表》的讨论只说不足，不谈成绩，但这并不意味我们否定《总表》的成绩。第二，下文将谈到的有些问题，其实并不源于《总表》，《总表》只是延续了在它以前的同类工具书的问题［2］。

《总表》检索系统的问题之一，表现在部首设置方面。

大处着眼，一种适用于古文字的部首系统是否合理完善，可以用如下两个相互联系的指标去衡量：一是文字检索的方便程度，也就是部首所提供的查字路径，是否能够帮助人们最便捷地找到相关文字；二是部首与字形的内在对应契合程度，在宏观上，部首系统应该恰到好处地统领字形系统中各个类别，尽量避免参差龃龉，而在微观的层面，部首应该是所对应字形的有机组成部分，而不应把字形割裂得支离破碎。依据这两个标准，《总表》在部首设置方面，存在互有内在联系的三个问题：

首先部首数量偏少。《中国大百科全书·语言文字》卷对部首的定义是“汉语字典里属于同一偏旁的部目”。部首的这种属性，把它和偏旁(或曰构件)的关系拉得分外亲近。如前文所述，目前通行的甲骨文部首数量为一百五六十个，而构件的数量则是这个数字的很多倍。依据在《总表》中选定的3300个甲骨文字形的分析统计，不计独体与合体差异，甲骨文构件数量为800个以上，即使独体甲骨文构件，数量也达460个左右［3］。作为甲骨文构形系统的基本构形成分，甲骨文构件无疑应该是部首设置的基础，而两者之间如此巨大的不对应，非但降低部首与字形的内在对应契合程度，也不可避免地影响甲骨文字形检索的方便程度。具体来说，因为部首少于构件，就导致了字形归部的多对一现象。仅以《总表》排序最前的取象于人体的三部为例，“人”部中有从身字(0016、0017、0018、0019)［4］、从尸字(0003)、从老字(0047、0051、0052)、从长字(0041)、从欠字(0121、0122)、从兄字(0155)等归入；“大”部中有从NF94A字(0278、0279、0280、0281)、从夭字(0271、0272)、从NE460字(0235、0236、0237)归入；“ND86A”部中有从NF641字(0381、0382、0383、0384、0386、0388、0390)、从欠字(0329、0331、0332、0334、0335、0336、0337、0338、0342、0343、0302、0327、0410)、从NB428字(0333、0330、0329、0339、0340)、从兄字(0301、0302、0306、0307、0308)归入。

很明显，这些字之所以被归入非自身所从构件的部首，是因为它们所从的构件未被列作部首。而这种无奈的多对一的对应非但不精确，而且具有一定的人为性，并不契合部首设立的本来意义。值得注意的是，这种现象，不完全是由《总表》对以前的甲骨文部首的延续而造成的，如岛邦男的甲骨文部首［5］本有“亡”部，而《总表》取消了这一部首，把该部字归入“其他”部。

当然，构件偏旁不等于部首，特别对于甲骨文这种非常复杂的文字系统来说，简单地依据构件来确定部首更是不可行的：由于甲骨文还带有一定图画性，构成字形的成分不都是具有频繁构字能力的，有的甚至是被固定在某个特定字形上的“图形构件”［6］，将这种只能统辖自己或者很少数同构件字的构件设置为部首，自然是不合适的，可以采取模糊对应法将它们归入取象相近的部首，或另设难检字部首。而如果构件具有较高构字频率，即其所统领的字有较多数量，那它就具有了成为部首的最重要的资本，而剥夺部首身份则需要格外慎重。据统计，甲骨文构件的平均构字频率为5.3左右，而在平均频率以上的构件有259个［7］，其中未列为现行甲骨文部首而有必要升格为部首的不在少数，这将在后文具体讨论。

二是部首的独体限制。现行的甲骨文部首均由独体构件充当，为什么要作这样的限定呢?姚孝遂先生有这样一番说解：“许慎所说的‘独体为文，合体为字’是很有道理的。文字最初只是一些最基本的符号形体。随着人类社会的不断进步与发展，为了适应日益增长的交流思想、记录语言的需要，孳乳分化成很多新的文字形体，而这些新的文字形体主要是由原有基本形体组合而成的。……人们注意到有许多不同的文字形体，在分析其结构时，发现其具有某一个共同的组成部分。将这个共同的部分标举出来，用以部勒所有的具有这个基本形体的文字，这就称之为部首。部首必须是能够独立存在的最基本形体。”(《类纂·序》)很显然，姚先生所说的“最基本形体”即独体字，而部首为什么必须是“最基本形体”呢?姚先生的理由可以简单归纳为：文字是由独体孳乳分化为合体的，因而一个特定的独体可以成为一群不同的文字形体的共同组成部分——部首。然而，这个逻辑显然经不起推敲。文字孳乳固然常常以独体的文为起点，但却不都是以独体为起点，合体的字也可以再孳乳分化为结构层次更复杂的合体字，此类例子太多，不烦举例。也就是说，合体也同样可以成为一群不同的文字形体的共同组成部分。那为什么部首只能由独体来充当呢?前文言及，实现部首检索的精确有效，和实现部首与字形结构的内在对应，才是部首的根本要义，而从这两个方面来考虑，独体的限制却有明显的弊端。在这一点上，《说文解字》富于启发性：《说文》部首合体独体并见，唯其如此，才保证了《说文》部首通常能够处于其所统摄的小篆字形结构的第一层次，进而保证了部首与字形结构的内在契合。举例来说，正由于设置了这个由“彳”和“止”合成的部首，才使得“徒”、“徙”等形声字的形符，和“逐”、“连”等会意字的一个完整的会意部件与其所属部首同一，而这种统一，对于按文字学原则设计的部首来说是一种基本要求。甲骨文由于其发展阶段早于小篆，总体来说，结构层次数要少于小篆，与之相应，合体构件数的比例要低于小篆［8］，但这只是量的区别，不能因此而取消甲骨文合体部首的应有地位。比如，未见于《总表》的甲骨文部首，但在甲骨文中“彳”和“止”已有明显的组合性，据统计，它们组合的构字频率已是甲骨文构件平均构字频率的三倍，达15次：

对比那些辖字量大大少于这个数量的现行甲骨文部首，剥夺“NEA44”的部首身份显然并不合适。

三是忽略与后世通用部首的对应性。不难发现，将设置为甲骨文部首还有一个好处：是一个为今人所熟悉的部首，如果它具有了甲骨文部首的身份，对于方便人们查检甲骨文字形是有益处的。由此不难发现《总表》部首设置的又一问题：没有考虑与后世字书通用部首靠拢。当然，从这一角度考虑改进甲骨文部首，应该添置的就不仅是合体部首了，诸如“彳”、“爪”、、“衣”、“方”、“耒”、“辰”、“豆”、“厂”、“身”、、“老”、“鬼”、“巾”“鼎”、“文”、“欠”、“鬯”等也应是需要优先考虑的候选部首。关于“彳”，有学者认为它在甲骨文中只是“行”的省写，因而不应视为一个独立的构字成分［9］，我们认为这种看法值得商榷。从渊源关系上看，“彳”确实可能生成于“行”的省写，但如果这种省写大量存在，甚至于比不省者还要常见时，却还是忽略它的独立存在，就不是一种尊重事实的态度：

以上从“彳”字形的数量已远远超过了甲骨文中的从“行”字形：

即使认定以上两组字中“彳”与“行”是构字意义没有差异(实际上在目前我们对甲骨文字构形理据认识还有限的情况下，这样的判断至少是冒失的)的简单的繁简关系而只设一个部首，也应选择“彳”而不是“行”。当然，基于目前的甲骨文考释研究现状，更为稳妥的做法是以形为本，两者均设为部首。

在字形归部方面，《总表》也存在不少问题。首先是非本部字归入，如下面几个字居然是归入“人”部的：

这类情况还有ND86A部中的0345/3、0397/2、0409/1，目部中的0657、0658，口部中的0791/3、0794/4，止部中的0893、0897，又部中的0960、0982，殳部中的1053，示部中的1151/1、1151/2、1151/3、1151/4、1151/5、1152/1、1152/2、1151/3、1152/4、1152/5、1162，夕部中的1196，山部中的1305，水部中的1387/4等。

很明显，把这些字形归入与本身构形毫无共同点的部首，不但违背了前文言及的“契合”原则，更会将部首的检索功用丢失殆尽。如果这些字的归部是由于偶然的疏漏造成的，那还只是属于局部性的小问题，然而事实上这种处理却属于编纂者归部的一种“体例”：《总表》沿袭了《殷墟卜辞综类》的模式，即把一些编者认为属于异体的字形排列在一起而不管它们是否属于同一部首，如因为是的异体字，就把不从“人”的前者同后者一起排在“人”部。这就意味着问题不是局部性的，而是系统性的了——这种体例与以形系联原则相悖，有违部首辖字的本质要求和意义。《说文解字》的重文归部，虽然也有貌似类同的情况，但是《说文》重文和正篆并不处于同一个层次，因此《说文》部首不管重文是说得过去的。而甲骨文的情况则根本不同，因此，如果说“异体相连”的体例是仿效《说文》，也难免东施效颦之嫌。

其次，有些字的归部破坏了字形结构理据的完整性。如《总表》62部“入”，收入若干从“衣”字：

而“衣”的甲骨文字形本是衣服的象形，类似于“入”的只是其描摹衣领部分的线条，据此把从“衣”字收入“入”部是把不可分割的构件形体生生地割裂了开来，也不合整个部首系统收字的常例。类似情况还见于63“今”部，收入了一些从“亯”、“京”、“高”等的字。从“亯”字如：

客观地说，由于现有研究水平的限制，目前我们对甲骨文构形系统的认识还是有局限的，对有些字的结构考释存在分歧甚至盲点，要让甲骨文字形完全保持字形归部中的构件完整是有困难的。但上述字形(至少是主要构件)的取象都是清楚的，如此归部不免匪夷所思。即使单纯从检索的角度来审视，这种破坏构形理据的归部也是极不可取的：甲骨文检索系统的使用对象主要还是甲骨文的研习者，他们习惯于或者说只认同甲骨文字形的文字学结构分析，破坏构形理据的另类归部将使他们在检字中无所适从。

字形排列失序是《总表》检索系统的第三个问题。其具体表现又有多种：一是同构件字类聚体例没有贯彻始终。由于无法按笔画数排序，以构件类型类聚就成为甲骨文部首内字形排列最自然的一种排序手段，但这一点并未被严格贯彻，以上述“今”部所收从“亯”、“京”、“高”字为例：从“亯”字本来是最先出现的(前表所列前四个)，但一部分又排到了后面(前表所列后四个)；而从“京”字与从“高”字则更是错综杂出，毫无规律可言。类似情况，在其他部也有不同程度的存在。二是先独体后合体的顺序时出例外。部首内同构件字类聚后又有个排序问题，先独体(即本构件独立构成的字)后合体(由本构件与其他构件组合而成者)无疑是一种最自然的选择。《总表》在多数情况下还是遵循这一原则的，但例外情况也不在少数，如“人”部0087和0088先后排列，但前者为合体，后者为独体。同类情况还有“ND86A”部中的0329、0330与0333，0329/A、0330与0334等。三是部内同构件合体字全无排序手段。如果说，同构件字的类聚及先独体后合体在《总表》的字序安排上还算依稀可见的大致原则的话，那么在同构件合体字的排列上，则是完全失控，根本无条例可寻，如上述“入”部中从“衣”的、编号从2121到2141的二十多个字的排列，就充分体现了这种混乱。

前文已经言及，《总表》检索系统的种种问题其实并非只是《总表》自身的个别问题，而是反映了现行甲骨文检字系统的整体问题。因此，由上述《总表》的种种不足引发开去，可以进一步探讨甲骨文检索系统的改进完善问题。基于以上分析，笔者以为，这种改进完善应该贯彻如下原则：

一是进一步贴近甲骨文文字系统的实际。现行甲骨文部首系统尽管也是将部首贴近甲骨文字形系统的努力的结果［10］，但从上文的分析，还是可以发现这种努力远未到位。究其原由，往往是过于考虑部首的一般属性要求而忽略了与甲骨文文字系统实际的契合度，如对部首的数量限制和独体限制，显然是为了简化部首系统本身，殊不知这种简化超过了它所统辖的文字系统实际所要求的起码繁复度，则效果适得其反。当然，为让部首设置最大限度地契合甲骨文构形系统的实际，需要对甲骨文构件作穷尽性统计，并逐个分析其是否具备部首所要求的基本条件及其进入部首的利弊得失，再作决断。从部首应有的数量限制这个角度看，目前通用的汉字部首一般为200个左右或者更多，如《新华字典》(1966年以后各版)189部，《汉语大字典》200部，新版《辞海》250部，1983年的《汉字统一部首表(草案)》也确定为201部(1998年又有修订稿)。这表明，部首单位数量在200左右或许是一个比较合理的数字，并不至于给使用者造成难以接受的记忆负担。由此看来，我们至少可以给现行甲骨文部首再增设部首50个左右。

二是最大限度地坚持文字学部首原则。汉字部首有文字学原则部首与检字法原则部首之分，前者强调部首辖字必须与字形结构及本义分析相统一，部首最好是所辖字的一个直接诉诸造字理据的构形成分，或会意部件，或象形或指事构件，或形声字的意符或者声符；后者则不必受此限制，只要构形上具有某种一致性，即可把某字归入某部首。文字学原则部首是由许慎依据保有象形特征的小篆创制的，当然也适用于构形系统更具有象形特征的甲骨文、金文等古文字，后者则适用于构形系统符号化了的隶变以后的汉字。很显然，甲骨文文字系统的性质决定了它的部首必须是文字学部首。而上述论及的现行甲骨文部首系统中存在的种种缺陷，诸如部首的独体限制、归字的割裂构件等等，就其根本而论，恰恰是在这个原则问题上出了偏差。

三是坚持文字学原则框架内以形为本一元排序标准。不难发现，前文言及的甲骨文部首系统的种种问题，每每与现行甲骨文部首允许与“据形系联”异类的“义类相从”原则发挥作用有关：“异体相连”，有时会把非本部字带入；因为将某些意义上有某种程度的接近(而且未必是学界公认的)的字相邻排列，就导致了同构件字类聚系列的断裂及独体合体次序的颠倒。我们并不否认“义类相从”本身具有的重要价值，但这种系联应该在另一个层面上进行，把它放在部首中去实现，则完全是进入了一个误区。部首系联，根本上说类聚和排序的标准是字形(文字学部首系联的这种标准则是具有共同义类的字形)，义类相从则把这种标准转换为字义，在一个层次上实行双重标准难免导致自身矛盾和冲突。义类相从的体例或许是效仿《说文》部首内排字的结果，而凭借《说文》部首系统去检索小篆的麻烦是众所周知的，因此这种效仿并非明智的做法。退一步说，即使义类相从本身是可行的，甲骨文采用这种模式也并不合适，因为我们对于甲骨文字意义用法的认识程度还没有达到要实行义类相从原则所需要的程度：就字形数量而言，目前考释已有定论的甲骨文字只占少数，在这种情况下，还是以更加直观的字形作为类聚和排序的标准比较稳妥。具体来说，要严格实行形义统一前提下的据形系联体例。部内归字，按三层次排序：1.同构件字类聚，如有接近的不同构件字归入，则各构件字以与部首接近程度排序；2.同构件字按先独体后合体排序；3.同构件合体字内部以与部首对应的构件的位置关系排序，大致可为先上后下、先左后右、先外后里；4.与部首对应的构件位置相同的合体字，先以部首外构件数为序，如先后。部首外构件数相同者再按构件的部首位序排序，如、，前一字部首外构件为“人”，后一字部首外构件为“羊”，而在部首排序中，“人”在前“羊”在后，故前后。

四是顺应数字化的文字处理要求，坚持超文本、多路径原则。应该说，岛邦男初创的甲骨文部首还是实施了一些多路径方法，“尤其是部首索引，采用分部重见的办法，只要认识甲骨文字的任何一个组成部分，即可据以检索有关的辞例”。这种体例曾被认为《综类》值得肯定的特点之一。［11］但也许是由于这种同一个检索对象多路径重见要占据更多的篇幅而很难被传统的文本出版形式所接受，所以这一做法后来似乎遭到摒弃，在《总表》中已完全不见这种体例。多路径检索的方便性是无可置疑的，如果说在传统文本形式中它还有多占篇幅的缺点，那么在数字化检索模式中，这一缺陷也就化为乌有了，因此，它有理由成为今后甲骨文部首系统中的基本检索原则。合体字一律实行多部首归字，如，须归入“宀”、“止”三部；，须归入“彳”、、“又”、“口”四部。

附注

［1］一方面，甲骨文在国际标准字符集中的编码工作已在进行，关于汉字电脑字符集的国际标准化组织IRG从2003年11月的第20次会议起至2005年5月的第24次会议，每次会议都把汉字古文字编码作为一项重要议题进行专题研讨。目前已确定甲骨文作为首批编码的古文字种类。另一方面，海内外已有研究机构正在进行甲骨文资料数字化开发，如华东师大中国文字研究与应用中心、北京师大汉字研究所、香港中文大学中国文化研究所等。

［2］比如，甲骨文部首为日本学者岛邦男在他1967年编成的《殷墟卜辞综类》中首创。其后学者编纂甲骨文字工具书，每每以岛邦男氏164部为基础，稍作改动，形成一个部首系统，如姚孝遂主编的《殷墟甲骨刻辞类纂》(中华书局1989年版)、于省吾主编的《甲骨文字诂林》(中华书局1996年版)将岛邦男氏164部削减到150部，沈建华、曹锦炎《新编甲骨文字形总表》又在姚氏150部的基础上进行微调，形成152部。

［3］［7］详参本人指导的华东师范大学竺海燕硕士论文《甲骨文构件与甲骨文字构形系统》。

［4］例字后括号中的数字为《总表》所收的甲骨文字形编号。

［5］(日本)岛邦男编.殷墟卜辞综类.日本：汲古书院，1967.

［6］刘志基.图形构件与甲骨文的构形系统.∥中国文字学会第三届年会论文集《汉字研究》(一).北京：学苑出版社，2005.

［8］对《说文解字》正篆进行构件分析，共得构件1970个，其中独体构件454个(相关数据详见华东师大中国文字研究与应用中心网站http:∥www.ideograms.org/“古文字查询检索系统”栏)；甲骨文构件总数875个，其中独体构件507个(数据详参见［3］)

［9］林NDA56.关于甲骨文“字素”和“字缀”问题.∥中国古文字研究(一).长春：吉林大学出版社，1999.

［10］岛邦男的164个甲骨文部首在一定程度上也是依据甲骨文自身特点而创立的，这一点曾得到学界普遍认同，姚孝遂在《〈殷墟卜辞综类〉简评》中给予这样的评介：“这种新的分部大胆地突破了旧的框框，总的方向是正确的，其基本内容是值得肯定的。”

［11］姚孝遂.《殷墟卜辞综类》简评.∥古文字研究(三).北京：中华书局，1980.

(华东师范大学中国文字研究与应用中心上海200062)

(责任编辑叶玉秀)

推荐访问:甲骨文字形新编完善检索系统

读《新编甲骨文字形总表》兼论甲骨文字形检索系统的完善

也许您还喜欢:

最新范文