面向信息处理的汉语同类词短语歧义研究_杨泉_AZW3_MOBI_EPUB_PDF_电子书(无页码)_杨泉

内容节选

第四章 方法论基础 第一节 复杂特征 美国语言学家乔姆斯基(N.Chomsky)在20世纪50年代提出了短语结构语法,它是自然语言计算机处理进程中最早提出的一种自动语法分析理论,这种语法使自然语言获得了可计算的性质。 还在人们对短语结构语法的出现兴奋不已时,很快就发现了它的局限性。首先这种语法在对语言进行识别的过程中常常难以区分相同的表层结构中所蕴含的不同层次关系和语法、语义关系;另外,在语言的生成过程中又会产生大量歧义的或不合格的句子。从前面用CTT的CFG语法为格式真歧义短语和实例真歧义短语画树形图的过程中,我们也可以看出CFG语法对潜在歧义结构的分析能力是很有限、有时甚至是无能为力的。为了克服短语结构语法的上述不足现象,先贤又纷纷提出新的语法理论,其中较有代表性的有:词汇功能语法(Lexical Functional Grammar,简称LFG),功能合一语法(Functional Unification Grammar,简称FUG),广义短语结构语法(Generalized Phrase Structure Grammar,简称GPSG),中心词驱动的短语结构语法(Head-driven Phrase Structure Grammar,简称HPSG),中文信息MMT模型(Multiple branched and Multiple labeled Tree Analysis,简称MMT)等。这些用于语言信息处理的语法都采用了复杂特征的方法,它是当代计算语言学的主要研究方法之一。 复杂特征主要采用“特征/值”矩阵来对语言进行描写,实质上是对人类知识的一种形式化表述方式,可以用它来扩展CFG语法,以此增强CFG语法描写语言结构的能力。LFG,GPSG,HPSG,FUG都是对CFG语法的扩展,英语是典型的屈折型语言,这个类型的语言语法的形式化标志比较明显,大部分采用词的性、数、格、时、体、态、词性、语义特征等作为属性标记。 而汉语是典型的孤立型语言,和英语等印欧语言比较起来,语法严格意义上的形态变化几乎没有,照搬英语中的“特征/值”系统对汉语进行形式化描写显然是不合适的。究竟采用何种复杂特征系统要依据汉语自身的特点来决定。 第二节 意合手段 汉语中经常被语言学家们提及的语法手段主要是虚词和语序。作为复杂特征,虚词的覆盖面显然过于狭窄,其描写手段也过于概括。 语序被传统语言学家看作汉语中极为重要的语法手段,可汉语的语序有时却显出很大的灵活性,如: A B (1)饭不吃了 —— 不吃饭了 (2)我送给他贺年片 —— 我送贺年片给他 (3)小王淋了一身雨 —— 雨淋了小王一身 A(1)与B(1);A(2)与B(2);A(3)与B(3)分别可以表达相同的含义而语序上却有很大的不同,而且语序只表达词与词的前后位置关系,并不涵盖对词语本身意义的描写,语序也不足以作为描述汉语的形式化手段。 怎样才能准确全面而又形式化地描写汉语的语法和语义关系呢?如果我们把语序不能解决的问题搞清楚,再把每个词自身的语法及语义特性形式化地描述出来,似乎就应该能够找到答案。到底是什么原因使得上面不同语序的词表达了相同的意义呢? 吕冀平先生在《汉语句法中的意合问题》一文中回答了这个问题,认为决定诸如此类语言现象的也是一种手段,并称它为句法中的意合手段[1]。 “意合”作为一个语法术语,最早始于王力先生的《中国语法理论》,不过王先生那时只把这个术语用于复句分析,他说:“中国的复合句往往是一种意合法,在西文称为parataxis(引者按,即不用连词而并列起一些clause)”。 《现代汉语语法讲话》中的解释是“以意会”,虽然这个解释过于概括,但吕先生却认为它“触到了一个接近汉语根本特点的问题:组词成句过程中,语法的形式标志并不处于不可或缺的绝对需要的地位,而主观上的‘意会’具有不可忽视的作用,最低限度同印欧系语言比较起来是如此”[2]。 吕先生认为“意合”是指“没有任何表示语法关系的语法手段,而能表达人们共同理解的相关意义,”这种意义是“对言内之意的意会,其结果不因人而异”。[3]他把意合手段界定为“词汇意义+结构框架+逻辑推断”三者相互协调的表意手段。具体表述这个界定就是:意合手段是深层的语义特征、表层的结构框架、具体的语言环境,即语义、语法、语用三者相互协调的综合运用,其中的“语用”不是严格意义上的pragmatics,而是指具体语言环境中对词句表达内容的逻辑推断[4]。笔者认为从传统语言学的角度来理解,“意合”就是指人们根据具体的上下文对概念意义上能够组合使用、相互之间没有冲突的语言单位理解出某种固定含义的语法手段。运用“意合”的观点,就可以解释为什么上面A、B两组句子虽然在语序上不尽相同,却也能够被人们所理解。 吕先生有关“意合”的解释是从人理解语言的角度......

  1. 封面
  2. 书名页
  3. 内容简介
  4. 作者简介
  5. 序言
  6. 序言
  7. 目录
  8. 引言
  9. 第一章 研究范围及基础
  10. 第二章 研究概况
  11. 第三章 理论基础
  12. 第四章 方法论基础
  13. 第五章 基于ontology的消歧方法简介
  14. 第六章 对于n+n结构的消歧策略研究
  15. 第七章 对于v+v结构的消歧策略研究
  16. 第八章 对于a+a结构的消歧策略研究
  17. 第九章 对于n+n+n结构的消歧策略研究
  18. 第十章 对于v+v+v结构的消歧策略研究
  19. 第十一章 n+n歧义消解的博弈论模型研究
  20. 第十二章 结语
  21. 附录1 ONTOL-MT中主要概念的含义
  22. 附录2 本书所使用的词类标记集
  23. 附录3 本书所使用的短语类型标记集
  24. 附录4 本书所使用的语义特征标记集
  25. 附录5 本书形式化语言简介
  26. 参考文献