• 工作总结
  • 工作计划
  • 心得体会
  • 述职报告
  • 事迹材料
  • 申请书
  • 作文大全
  • 读后感
  • 调查报告
  • 励志歌曲
  • 请假条
  • 创先争优
  • 毕业实习
  • 财神节
  • 高中主题
  • 小学一年
  • 名人名言
  • 财务工作
  • 小说/有
  • 承揽合同
  • 寒假计划
  • 外贸信函
  • 励志电影
  • 个人写作
  • 其它相关
  • 生活常识
  • 安全稳定
  • 心情短语
  • 爱情短信
  • 工会工作
  • 小学五年
  • 金融类工
  • 搞笑短信
  • 医务工作
  • 党团工作
  • 党校学习
  • 学习体会
  • 下半年工
  • 买卖合同
  • qq空间
  • 食品广告
  • 办公室工
  • 保险合同
  • 儿童英语
  • 软件下载
  • 广告合同
  • 服装广告
  • 学生会工
  • 文明礼仪
  • 农村工作
  • 人大政协
  • 创意广告
  • 您现在的位置:六七范文网 > 其它相关 > 正文

    基于组块分析的汉语块依存语法

    来源:六七范文网 时间:2022-12-19 13:55:04 点击:

    钱青青,王诚文,2,王贵荣,饶高琦,3,荀恩东

    (1. 北京语言大学 信息科学学院,北京100083;

    2. 北京大学 计算语言学教育部重点实验室,北京100871;3. 北京语言大学 汉语国际教育研究院,北京100083)

    句法分析是自然语言处理领域中重要的基础研究问题之一。依据句法结构的差异性,可将句法结构分为短语结构和依存结构,其中依存句法以能够适应汉语灵活语序特征且将句子分析为更加扁平的结构以降低分析、标注、储存难度的优势,近年来获得了更为广泛的应用,在问答系统、知识图谱、信息抽取等任务上发挥着重要作用。

    在句法分析中,明确分析的单元是最基础、最根本的要求。传统依存句法分析大多以词作为最小单元,但分词及词性标注可能带来错误级联。在汉语实际语篇中,词的词性、词义较为灵活,存在大量的活用、增加语境义的现象,传统依存句法分析较难适应该特性。汉语具有意合特征,同样的语义内容可由语序的不同单元表达,过于关注“词-词”关系,使句子依存结构更为繁琐。词与词之间的关系复杂、多变,依存关系类划分得太细,降低了标注的可操作性,带来数据稀疏问题,也会影响分析器的适应面和鲁棒性。

    例1承租户与房东之间的矛盾和纠纷有愈演愈烈之势。

    例2我直觉地认为鲁迅是非常中国的人物。

    在例1中,主语相对复杂,此处将主语内部词“承租户”切分开,把“承租”当成了全句的核心,从而也导致了整句依存结构的错误,此为由于分析时陷入复杂 “词-词”关系分析的困境而产生的错误;
    在语序方面,若交换“承租户”“房东”或“矛盾”和“纠纷”的语序,甚至将整个主语倒装,变为“矛盾和纠纷,在承租户与房东之间的”,句子的语义也不会发生较大的变化,但分析结构却会因此改变,这是不必要的。而例2中“中国”意为“具有中国品质的”,但此处在分析时仍然将“中国”和“人物”定义为“领事”关系,认为“中国”是一个实体,这是由于无法识别其中活用的信息而导致的。

    除了基于词的依存句法分析本身存在的问题,汉语的特殊性也为句法分析带来了困难。

    中文多小句、流水句,而当前的中文树库中大多利用逗号、句号等标点划分分析边界,容易导致分析单位缺少成分、信息丢失,经过分析,我们发现汉语中至少有25%的小句存在成分缺失的现象(1)具体分析请见《汉语块依存语法与树库构建》。当流水句中后续小句的主语缺失时,还可能产生歧义: 空主语既可能跟先行小句的主语(A)同指照应,又可能跟先行小句的宾语(B)等其他成分同指照应。修饰词(如否定词等)的辖域问题也会导致歧义的产生[1]。

    例3她不像她母亲,认为做家务的男人都是没有出息的。

    例4他有票,我没有。

    例51991年,女足世界杯首次举行,有12支队伍参赛。

    在例3中,句子呈现为两个小句,“她不像她母亲”和“认为做家务的男人都是没有出息的”。这个句子形成的图结构是分离的,后一小句的主语既可能是前一小句的主语“她”,也可能是前一小句的宾语“他母亲”,显然主语的不同会导致语义的差别,若割裂地看这个句子,会产生歧义。除了主语缺失之外,例4、5分别为宾语缺失、修饰语缺失。主宾语缺失的问题,已有学者从“篇章回指”“指代消解”等角度进行分析,如陈平[2]、徐赳赳[3]等,但仅限于实体之间的指代关系,忽视了提供大量情态信息的修饰语的缺失问题。宋柔[4]关注到了除实体之外缺省补全的重要性,他将汉语的句子界定为自足的广义话题结构,把小句界定为基于广义话题结构的话题自足句,利用流水模型生成这两类汉语篇章结构单位,为自然语言处理篇章分析单位提出了新的角度,从汉语篇章微观话题结构的角度为流水句提供了佐证和启示[4-5]。但汉语中标点句并非只缺省句首的话题成分,句中或句尾的状语、宾语、补语等的缺省也值得关注;
    按照广义话题结构所生成的句子仅仅提示其“话头-说明”结构,与句子更深层次的句法语义分析之间缺少衔接,大多还是停留在拆分复杂结构,生成“能说”的自足句层面。

    例6他把衣服抖了抖,然后穿上。

    例7没有人民民主专政,就不可能保卫和建设社会主义。

    话头理论的目的是寻找缺省的话头并生成话头自足句,但生成的话头自足句可能由于句法不通、语义不明等导致“不成句”。如例6中的第二个小句,生成的自足句为“他把衣服然后穿上”,这是由于话头结构是线性分析的,强调“话头”和“说明”的语序,遇到语言中一些比较灵活的现象时,就会产生不成句的问题;
    此外,“话头-说明”的关系情况多样,可能是句法上的主谓关系,也可能是语义上的衔接关系,就使得在标注时存在两可情况,也可能与篇章级别的分析产生混杂,如例7中的“话头-说明”关系一般认为是复句中的条件关系。

    指向不明确也会使句子分析不准确,下面这几个例子结构相似,但句子中名词性短语、修饰性短语受哪些动词的支配却不尽相同。

    例8老师让小张来办公室一趟。

    例9我们洗衣服挺累。

    例10我劝他手术好几天了。

    针对以上问题,我们提出汉语的块依存语法,以组块为研究对象,以谓词为核心,在句内和句间寻找谓词所支配的组块。分析时,利用汉语中的组块和组块间的依存关系,将成分缺失和指向不明的问题转化为小句内组块依存问题和小句间的组块缺省问题。补全缺失的成分,为后续任务提供准确的分析单元,消除由于指向不明确而导致的歧义。

    由于汉语句法的特殊性,“块”具有很好的现实意义。“块(Chunk)”概念最早由Abney提出,他认为句法分析可以分为三个阶段来进行,以达到简化句法分析任务的目的,即对块进行识别、分析块的内部结构、分析块之间的关系[6]。本阶段的主要工作为第三步。

    我们将组块定义为: 由连续词语或语素整合而成的序列,表现为同一句子层级中充当句法成分的各个连续单元,例如下面这个句子被分为4个组块。

    例11这句话 | 只 | 是 | 一个例子。

    组块按照其功能,可分为如图1所示的各个类型。

    图1 组块体系

    1.1 谓词组块

    谓词组块即由核心述语构成的组块,能够支配句中的非谓词组块,是所在句子层级的核心,由最内部的小括号“()”表示。谓词组块主要由动词性、形容词性的词或短语(2)一般由“V+着了过”“V+单音节补语”“两个连续的单音节V”组成,字典中收录成语、常用俗语等也作为谓词组块。来充当,在一些特殊句中也会有空谓词组块的存在。句子中最顶层的谓词组块(即整个句子的核心)是核心谓词组块,出现在修饰语中的谓词组块为非核心谓词组块。

    例12他(狼吞虎咽地(吃完了))饭。

    例13这个人()黄头发。

    例14我(现在(承认)){你((做)得比我好)}。

    以上划线部分均为核心谓词组块,其中例13由补充的空述语充当。例14的核心谓词组块“承认”是整个句子的核心,而非核心谓词组块“做”是宾语“你做得比我好”中的核心。

    例15{浦东(开发)(开放)}(是)一项振兴上海\,建设现代化经济、贸易、金融中心的跨世纪工程。

    例15中画线谓词“振兴”“建设”均为修饰成分中的非核心谓词,目前的块依存语法分析主要针对句子中的骨干结构,因此该类非核心的谓词将在下一阶段的工作中集中进行处理。

    1.2 非谓词组块

    非谓词组块指在结构上依存于谓词组块的组块,主要有主语块、宾语块、状语块、补语块几类。

    1.2.1 主语块

    主语块即结构中的主语,包括主谓谓语句中的大小主语。按照其内部是否还嵌套有谓词组块可将其分为体词性主语块和谓词性主语块。主语块在结构上依存于谓词组块。以下几例中的横线部分为主语块:

    例16他((说话)很快)。

    例17电脑{我(可(是))门外汉}。

    例18{(很(丰富))(却不(精细))}(也不(是))我们说的优秀。

    1.2.2 宾语块

    宾语块即结构中的宾语,按照其内部是否还嵌套有谓词组块可将其分为体词性宾语块和谓词性宾语块。宾语块在结构上依存于谓词组块,谓词性宾语用“{ }”表示,双宾之间用“||”隔开。以下几例中的横线部分为宾语块:

    例19[在他壮年时,]他(爬上过)珠峰。

    例20我(现在(承认)){你((做)得比我好)}。

    例21(感谢)你(告诉)我||这个好消息。

    1.2.3 状语块

    状语块指述语中位于谓词组块前部与其紧邻或被其他成分或标点隔离的组块,对核心语块起到修饰作用,受谓词组块支配。以下几例中的横线部分为状语块:

    例22(一年内(新增))培育科技型企业||3465家。

    例23[别把孩子的教育,](全(寄))希望[于教育机构上]。

    1.2.4 补语块

    补语块指在句中充当补语的组块,一般位于谓词组块后部,可与谓词组块紧邻或被其他成分或标点隔离,对谓词组块起到修饰作用,受谓词组块支配。以下几例中的横线部分为补语块:

    例24她(哭着)((跑)出来)。

    例25[别把孩子的教育,](全(寄))希望[于教育机构上]。

    1.3 衔接组块

    衔接组块由连词、话语标记、插入语等组成,在句中主要发挥衔接功能,属于篇章成分。用尖括号“<>”表示,以下横线部分为衔接语块:

    例26她(非常不想(去)),<因为>(今天(下))雨。

    1.4 辅助组块

    辅助组块由辅助语构成,句法上与句中其他各个成分之间没有结构上的关系,在句中主要承载表达语气的功能,用“<<>>”表示。以下各例中横线部分为辅助语块。

    例27他(走了)<<吗>>?

    例28<<嗯>>,<<好的>>,我(知道了)。

    2.1 块依存语法的表示

    块依存语法主要分析非篇章成分的组块,即基于句法结构层面的6类组块,通过分析对象的选择,可将构建自足小句的过程与篇章关系的界限划分清楚。衔接组块用于表示句间的衔接关系,辅助组块则承载了表达语气的功能,均不应与句内的成分混杂。

    在分析句子内部成分时,我们认为核心谓词组块是句子的核心,各类非谓词组块均受核心谓词组块的支配并依存于核心谓词组块之上,若某非谓词组块和谓词组块之间存在依存关系,则称该非谓词块为谓词组块的从属成分,谓词组块为该非谓词块的依存对象。

    除了一些特殊的独词句,一般认为句子中都存在一个或多个核心,非谓词块至少依存于一个谓词组块之上。谓词组块作为句内各语块的依存对象,其左右,上下各有四个点位,分别表示其主语位(1号位)、修饰语位(2号位)、宾语位(3号位)、述语位(4号位),各非谓词组块按照其类别分别依存于谓词组块的四个节点上,依存线条从谓词组块的四个节点指向其从属成分,如图2所示。

    (1) 主语,包括主谓谓语句中的大小主语依存于谓词组块的1号位。

    (2) 状语、补语依存于谓词组块的2号位。

    (3) 宾语,包括双宾语中的远近宾语依存于谓词组块的3号位。

    (4) 述语省略时从4号位置与相关述语连接,当某谓词组块依存于其他谓词组块时从4号位向外依存。

    图2 块依存语法分析图示

    不同于Robinson所提出的四条依存分析方法的公理[7],块依存语法分析中,允许非谓词组块、非核心谓词组块有一个或多个依存对象,允许谓词组块有多个从属成分,且允许线条交叉、跨句。中文中存在较多的非投影结构[8],允许线条交叉、组块多依存对象,能够使分析结果更清晰、准确。

    例29他(打开)门,((走了)进来)[,悄悄地]。

    此例中,前一小句缺少了修饰成分“悄悄地”,后小句缺少了主语“他”,必然导致分析不完整。在块依存语法中,允许线条跨句、交叉,找到两个小句中核心谓词的所有从属成分,即可将两个小句补充完整。

    2.2 块依存语法的分析方法

    在下述两例中,“承租户与房东之间的矛盾和纠纷”“非常中国的人物”均为一个组块,语义具有相对的稳定性,更符合语言的认知规律。以组块为研究对象,能够减少分词碎片,降低活用、语境义等带来的分析错误;
    同时,避免纠结于“词-词”之间的关系,使得依存关系得到了精简,更关注于句子的整体结构,进一步降低存储和分析的复杂性,加强鲁棒性。在此基础上进行分析,能够在保证浅层结构正确的情况下为更深层次的分析打下基础。

    例30承租户与房东之间的矛盾和纠纷有愈演愈烈之势。

    例31我直觉地认为鲁迅是非常中国的人物。

    其次,通过跨句找回依存块,能够补全句子成分。组块缺省指在线性的结构标注中由于承前蒙后省略或小句分割等情况导致核心谓词组块在该小句内缺省了从属成分,在这样的情况下需要将句子在上下文中进行分析,并在其四个节点处补全缺省的从属成分。

    例32他(把衣服(抖了抖),<然后>(穿上)。

    在这个例子中,小句“穿上”缺省主语块和状语块,我们在这里以缺省的主语块为例,将其用“∅”表示,因此依存于“穿上”的主语块是“∅”,而“∅”是前一小句“他”的省略。因此,为了寻回缺省的组块,使后一个小句成分完整,我们认为前一个小句的主语块“他”除了依存于所属小句的核心谓词组块“抖了抖”,也依存于后一个小句的核心谓词组块“穿上”。在补全了缺省的组块之后,我们还可以将前后两个小句拆分为: “他(把衣服(抖了抖)”和“他(把衣服(穿上))”,这样二者在这一个简单的上下文中就没有缺省的从属成分了。篇章层面的组块“然后”并没有依存的对象,也就不进入自足句构建的过程,仅用于表示两个小句之间的顺承关系。以上的补全过程是在排除了篇章层面的组块之后以结构为指导的、句法层面的补全,能够与下阶段分析句间关系相衔接,且更具有理据性——能够成为另一个小句的一部分是因为它受到其中动词的支配。

    针对依存对象不明确的问题,则通过寻找谓词的依存块,更好地明确句意。我们看以下这个例子:

    例33我(之前(劝))他(手术)[好长时间]<<了>>。

    对于这样的句子,一般的处理原则是“默认左归”或者“默认右归”,采取“左归”方法时,认为“他”是“劝”的宾语,但和“手术”之间没有关系,“好长时间”是 “手术”的修饰语。如果按照这样分析,这个句子的意思可能就变成了: 我之前劝他,我手术好长时间了。但显然,这句话并非这个意思。因此我们判断其依存对象时,认为“他”既是劝的从属对象,也是“手术”的从属对象,而“好长时间”则是“劝”的从属对象。这样,能够对这一类句子达到更好的分析效果。对兼语句、连谓句等特殊句式,也能进行很好的区分和分析。

    按照缺省的组块类型,我们将组块缺省分为非谓词组块缺省和谓词组块缺省,如以下示例。

    (1) 主语块缺省

    主语块缺省即句子或小句中的谓词成分因省略或标点等原因缺少从属的主语块。事实上,有相当一部分的主语块缺省是由于语音上的停顿、语篇成分的插入造成的,在书面上表现为标点、衔接语、辅助语等。当忽略这些成分时,我们发现这类小句可与前后带有主语块的小句形成复谓或并列结构,从而找回主语块,主语块缺省时依存关系因其体谓性的不同可分为NP-SBJ和VP-SBJ。

    例34肖科平(不再(理))他,(在梳妆镜前(坐下)),(端详着)自己(出神儿)。

    此句中,“坐下”“ 端详着”“ 出神儿”缺省了主语,“端详着”“出神儿”还缺省了状语,找回后,我们可以将其补充为完整的三个小句:

    ①肖科平(不再(理))他,

    ② 肖科平(在梳妆镜前(坐下)),

    ③ 肖科平(在梳妆镜前(端详着))自己(出神儿)。

    (2) 宾语块缺省

    例35我们(要正确(调查))(制定),<并>(执行)职工人员的使用、调配、奖励等制度。

    宾语块缺省即句子或小句中的谓词成分因省略或标点等原因缺少从属的宾语块,依存关系可因宾语块的体谓性而分为NP-OBJ和VP-OBJ。在这个例子中,两个小句都缺省了一些成分,其中前一小句中的两个核心谓词缺省了宾语块,后一个小句的核心谓词组块“执行”缺省了主语、状语。进行分析后,我们可将两个小句补全为:

    ①我们(要正确(调查))(制定)职工人员的使用、调配、奖励等制度,

    ② 我们(要正确(执行))职工人员的使用、调配、奖励等制度。

    此句中的“并”属于衔接组块,用于提示篇章中上下文的衔接关系,是我们下一步工作所需要关注的对象。

    (3) 状语块缺省

    状语块中承载了大量的时地信息、情态信息,然而位于句首的状语在分句的时候,易随第一个小句进行切分,而第二个小句就因此缺少了这个状语。如例36中,我们可以将“近年”重新依存至“拥堵”,将后一小句的时间信息补充完整。

    例36[近年]私家车出行数量(大幅(增长)),我市道路(越来越(拥堵))。

    拆分后的完整小句为:

    ① [近年]私家车出行数量(大幅(增长)),

    ② [近年]我市道路(越来越(拥堵))。

    (4) 补语块缺省

    状语块缺省即句子或小句中的谓词成分因省略或标点等原因缺少从属的状语块。在例37中,补全“几天”作为“唱歌”“跳舞”的补语之后,为其增加了时间信息,句意更完整了。状语块和补语块与谓词间依存关系为NUU-MOD。

    例37他们几人(在一块儿(唱歌)),(跳舞),((玩闹了)几天)。

    (5) 谓词组块缺省

    谓词组块缺省是我们认为的一类特殊缺省情况,指由于省略前文中已出现过相同的核心谓词组块而造成的缺省。在这样的情况下,需要将缺省的核心谓词组块依存到原有核心谓词组块上。通过这种方法,我们可以补全原本缺省的谓词,使得句意更加清晰,该类关系表示为VP-EMP。对于例38:

    例38[2014年]中国黄金(完成)矿产金生产||40吨,()矿山铜||11万吨。

    经过分析之后,生成的完整小句为:

    ① [2014年]中国黄金(完成)矿产金生产||40吨,

    ② [2014年]中国黄金(完成)矿山铜||11万吨。

    2.3组块分割与小块依存

    一般进行块依存分析时,非谓词组块以整体的形式充当谓词组块的从属成分,但在某些特殊情况下,存在小块依存的现象。小块依存指在一个组块内部划分更小组块,进行依存关系构建。在小块依存中,谓词组块的从属成分并非是一个完整的组块,而是某个组块的一部分。小块依存现象在体词性的主宾语组块以及状语、补语组块中较为多见。

    体词性主宾语块的小块依存多出现在定语和中心语之间存在从属或整体部分关系的情况下。例39中第二个小句通过块依存方法可找回主语并补全。

    例39他的书包(掉了),(很(伤心))。

    有部分状语或补语组块内部不同的部分从属于不同的谓词组块,此时也存在小块依存的现象。如例40中,若不分割组块,则“应该为人民”仅修饰第一个“奋斗”,将状语分割并重新分析其依存关系之后,能够更明确三个核心谓词“奋斗”的状语,在补全主语之后,即可形成3个完整的小句。

    例40新一代青年(应该为人民(奋斗)),(为国家(奋斗)),(为自己(奋斗))。

    否定性词语对于确定文本中的事件到底发生与否和是非评价有决定性的影响,尤其是否定词的辖域到底管到哪儿也决定了信息抽取的准确性。例41中:

    例41吕先生[和许多严肃的学者一样,](不会随便(去))别人家(串门),(把宝贵的时间都(浪费)在无聊的事情上)。

    若无小块分割及跨小句的依存,则后一小句的语义与正确语义截然相反。而正确的语义应为:

    ① 吕先生和许多严肃的学者一样,不会随便去别人家串门,

    ② 吕先生和许多严肃的学者一样,不会把宝贵的时间都浪费在无聊的事情上。

    目前,我们正在展开基于块依存语法的树库构建,经标注实践验证,该理论体系及表示方法能够覆盖绝大部分的语言现象,详细的构建方法、过程及数据分析请见另文讨论,以下简要进行介绍。

    基于块依存理论,以数据标注规范作为指导,通过两两对比标注的模式,在基于浏览器的在线标注系统中,我们标注百科和新闻领域文本,构建了汉语块依存树库。截至2020年8月,树库规模为187万字符,其中包含67%新闻文本和32%百科文本(仍在扩展中)。

    其中,新闻文本来源于新浪2006年新闻、新华社2012—2018年新闻;
    百科文本来源于百度百科,分属自动化控制系统、电子学与计算机、轻工、大气与海洋及水文科学、航空航天、经济学等领域(表1)。

    表1 各领域文本标注统计

    当前树库中共包含299 763个谓词词符,13 425个谓词词形。其中约有1 877个谓词(token)无从属成分,其余谓词均至少支配一个从属成分,依据目前定义的6类谓词和组块之间的依存关系,统计结果如表2所示。

    表2 各类依存块依存情况统计

    从统计结果上看,在出现的13 000多个谓词中,进行缺省补全后约有87%的谓词可支配名词性主语块;
    其次为修饰语块,76%左右。这表明汉语中谓词支配主语和修饰语的普遍性,在明确动词具备支配该类组块能力的情况下,进行缺省补全是有必要的。另外,谓词支配修饰组块的能力最强,树库中平均一个谓词可支配1.432个修饰语块或小块。修饰语块中携带了大量的情态、时间、地点等各类语义信息,但内部结构相对复杂,存在框式结构、介宾短语等内部成分,因此进行小块切分,能够便于后续的语义角色分析、情态结构分析等工作。单个谓词支配名词性主语和宾语的组块数量相对较少,但仍略大于1,则表明语言中主谓谓语句及双宾语的现象占少数,后续工作中分析单主语和单宾语与谓词间的语义关系应作为重点,而相对于双宾句,主谓谓语句优先级更高。

    块依存语法是一种结合了组块分析、依存语法的语言分析方法。块依存语法以组块为研究对象,能够避免纠结于“词-词”之间的依存关系,关注句子的整体结构,进一步降低存储和分析的复杂性,也能够达到减少分词碎片、加强鲁棒性的目的;
    关注句法结构层面的组块,能够厘清“句内-句间”的界限,为篇章关系分析打下基础;
    以谓词为核心,在上下文中找到其支配对象,能够在句子层面补全缺省成分的同时明确内部成分的指向、句子结构。此外,块依存语法不仅关注常出现在句首的主语、状语成分,也关注经常出现在句中或句末的宾语、补语等,使生成的句子更加完整。

    我们还注意到,以谓词为分析对象使得句法分析根据灵活。块依存语法分析能够以块依存图的形式对句子进行展现。整个句子以空节点为根,指向句中的核心谓词,核心谓词又有各个线条指向其支配成分。在篇章关系分析中,无论是寻找句间关系还是直接分析谓词间关系,都能够以更准确的分析单元为着力点。

    袁毓林曾将信息抽取所需的语义知识分为三类,分别为宏观篇章知识、中观论元结构知识、微观层次的逻辑结构知识[9]。块依存语法能够解决微观层次的逻辑结构知识,并为中观论元结构知识和宏观篇章知识打好基础。事实上,核心谓词的支配成分除了特殊的空述语之外,均可与汉语中的论元结构挂钩,其余的状语成分、补语成分也可提示情态信息,此时的谓词论元、情态成分等均已齐全,仅需进行分类即可。在宏观层面,已明确的篇章分析单位,结合其余的辅助组块、衔接组块,为分析篇章的逻辑语义关系带来便利。

    本文提出了汉语块依存语法,并介绍了其标注体系以及截止目前构建的树库规模。块依存语法在句内和句间寻找缺省的组块,补全缺省成分,以此为基础,能够更深入地进行篇章层面的“小句→句间→篇章”关系探索。块依存语法与具体的语境、语用环境相结合,能够较好地解决当前中文自然语言处理中存在的分析对象不明确、依存对象不清晰、成分缺失等问题,更好地服务于事理图谱、知识图谱、问答系统、信息抽取等各项任务。

    猜你喜欢 组块宾语状语 直接宾语和间接宾语用法精练初中生学习指导·中考版(2020年8期)2020-09-10组块教学在小学语文教学中的运用小学生作文辅导·下旬刊(2020年5期)2020-07-23组块理论的解读及启示中学课程辅导·教师通讯(2020年22期)2020-02-04宾语从句及练习疯狂英语·初中版(2019年12期)2019-01-02试析“词汇组块”教学在高中英语教学中的实际运用中学生英语·外语教学与研究(2017年4期)2017-04-14状语从句时代英语·高三(2014年5期)2014-08-26让你的记忆力更棒小学生时代·综合版(2009年11期)2009-12-29小议宾语补足语中学生英语高中综合天地(2008年10期)2008-12-22直接宾语和间接宾语中学英语园地·教学指导版(2008年10期)2008-11-25

    推荐访问:汉语 依存 语法