自然语言理解浅谈

摘要：长久以来，作为人工智能的关键问题，自然语言理解的发展一直局限于以词汇、句法、语义、语用的分析为基础。无论是机器翻译，语料库研究，语篇理解研究，还是概念层次网络理论，只是研究形式不同，究其根本都是在进行语言规则与统计的研究，都未能脱离传统模式的束缚。本文突破传统，从信息属性着手，提出了信息耦合属性概念。

关键词：自然语言理解；人工智能；信息耦合

自然语言理解是人工智能的一个重要分支。国外自然语言理解研究较早，也诞生了诸多较有影响的理论。自二十世纪50年代以来，在众多语言学家、逻辑学家、心理学家等的努力下，各种关于自然语言理解的理论体系纷纷诞生。其中较有影响的有：转换生成语法、依存语法、语义网络、蒙塔鸠语法、扩展转换网络、系统语法、格语法、概念依存理论、境况语义学等。近年来，语料库语言学又得到迅速发展。国内自然语言理解研究起步较晚，要从二十世纪70年代末算起。早期阶段以语形分析为主，中期及中后期开始注重语义分析并开始探索基于语料库的统计方法。近期则语料库统计与规则分析并重。

对于自然语言理解，从国际上看当前的问题主要表现为，一方面是哲学，认知科学，思维科学和心理学等学科所研究的层次太高，太抽象，宏观与微观隔离，提出的方案根本无法付诸具体实施；另一方面是，一直局限于以语法、语义、语境研究为基础的应用语言学所研究的层次太低，谈不上是真正的自然语言理解。就国内而言，其特点是：课题比较分散，应用项目偏多，基础研究比例略少；选题时，容易跟着国外的选题走，立项论证时，关键考虑国外怎么做，很多课题没有取得理论上的突破。

总的来看，无论是国外的研究还是国内的探索，各种自然语言理解方法理论体系归根结底都毫无例外地遵循下面的原则：1.把所需要研究的语言问题形式化。2.找出解决问题的相应算法。

然而审视问题角度的差异常常会从根本上制约我们对事物的认知。就如同我们怎样看待苹果落地一样。是苹果天经地义就应该落地，就像我们已经认知的其他万千事物一样，不需要再考虑，还是另有引力促成？对于自然语言理解是必须把所要研究的语言问题形式化，得出其相应算法，就像长久以来人们对其认知的情况一样，不需要再考虑，还是另有信息属性促成呢？

众所周知，计算机解决问题的关键是算法。但我们人类为计算机赋予某种算法后，计算机也只能解决这些算法能使其解决的问题。自图灵测试提出以来，人们想尽各种方案来解决这一难题。但人们最终发现，计算机执行命令是必须要有算法的，只要计算机按照一定的算法去执行一定的命令，那么似乎它就永远也不可能突破图灵测试，无法实现真正的自然语言理解。除非有一种算法，这种算法可以使计算机像人类一样接收外界万事万物的信息，并对其做出自主的反应。然而，当前来看，这似乎是不可能的。因为外界万事万物的信息数量是无限的，其变化发展亦是无限的。我们根本无法找出所有信息的特点及信息与信息之间的关系，并将其赋予计算机，使得计算机能够对任何信息做出合理反应。

从算法的角度看，人的智能是灵活无限的，而计算机只能按照人编排好的算法去执行有限的命令。目前，尚无一种算法能够完成对所有事物关系的认知。只要我们赋予计算机以一定的算法，就无法使其真正智能化。而没有算法，计算机解决问题就无从谈起。除非能找到一种无算法算法，才可能使其从根本上有所突破，否则就谈不上是真正的自然语言理解。而这听起来就是矛盾的。

那么，从审视计算机的角度来看，人脑的智能应是何来呢？是人脑中天生就存有宇宙中所有事物的关系，所以才有着无限的认知能力么？显然，这是荒谬的。那么，人是如何能了解宇宙万物的呢？既然不是内有，那么就一定是外来。这些关系一定存在于事物信息之中。

如果事物关系是存在于信息自身当中，那么就恰恰为无算法算法的实现提供了充分必要条件。所谓无算法算法，其中算法就是指赋予计算机以一定的算法去处理信息，无算法就是对于外部世界无限数量的具体信息间的逻辑关系与处理方案，是根据信息耦合属性，从信息自身中去提取而不是人为去赋予。

那么，信息在什么结构环境下，怎样交互作用才会解出事物关系呢，这会不会是一种极为复杂的情况呢？有人认为，在对人脑没有透彻的了解之前，无法实现真正的智能。这就好比是在说，在没有找到能飞上月球的鸟进行研究之前，人类是不可能制造出登月飞船的。

试想，人类是在自然环境下进化而来的。这是个极为缓慢的过程。从单细胞生物开始，到目前经历了数十亿年，生物体长久以来绝大部分机能还只是用在维系生命体的存活上了。万千生物当中，目前，也只有人类一种生命体达到了智能的水平。因此，从历史的角度来看，智能到目前为止还应该是一个基于生物性基础上萌发的一个相对极为简单而绝非复杂的事物才对。

对于自然语言理解，之所以长久以来找不到能真正解决问题的答案，问题在于前提条件的错误。人们假定了这样前提条件，计算机在什么条件下执行什么样的命令要由人来预先指定，接下来一切对于答案的努力都是基于这个错误的前提下进行的，因而找不到答案。

[参考文献]

[1]冯志伟.机器翻译研究[M].北京：中国对外翻译出版公司.2005.

[2]黄昌宁.统计语言模型能做什么？[J].语言文字应用，2002，1.

[3]黄曾阳.HNC理论概要[J].中文信息学报.1997，11.

作者简介：胡振波（1979.6-），男，吉林省舒兰市人，学历：硕士，专业：英语语言学，研究方向：应用语言学。

推荐访问:自然语言浅谈理解

自然语言理解浅谈

也许您还喜欢:

最新范文