接上一篇笔记~
汉语词类及范畴化的策略 - 优势分布和劣势分布
普通人的词类概念来自词跟词之间的分布相似性,并且普通人的词类概念又会直接影响词在言语中的具体使用,为此袁毓林提出了优势分布和劣势分布的观点。
词类功能的不平等性
所谓词类功能的不平等性是指某个词类虽然可以作多种句法成分,但是分布概率是不相等的,比如:
- 名词主要作主、宾语,作定语不如作主、宾语常见;
- 动词、形容词虽然可以作主、宾语,但在大多数情况下,动词主要处于谓语的位置;
- 形容词主要处于谓语和修饰语(定语、状语和补语)的位置。
反过来说,句法成分对词类也有一种优先选择:
- 主、宾语主要由名词来担当,
- 谓语主要由动词、形容词担当,
- 补语主要由形容词来担任。
也就是说,词类的多个功能之间有优势分布和劣势分布之别,作谓语是动词、形容词的优势分布,作主、宾语是动词、形容词的劣势分布。词类的优势分布相当于人的第一职业,劣势分布相当于第二职业。
显然,在日常生活中人们通常是按第一职业来确定人的身份的。同样,人们正是根据词的优势分布这种主要功能来聚类,从而形成关于词类的初步知识。因此,我们在给词分类时,也要充分注意到词的优势分布和劣势分布的差别,全面合理地利用成分功能这种描写框架。
词和句法成分的关系
从词和句法成分的关系的角度看,大多数词可以作主语、宾语、定语或谓语、补语、状语等句法成分,这种词可以叫实词。
少数词不能作上述句法成分,这种词可以叫虚词。
虚词里面又有两种情况,大多数虚词必须附着在其他词或词组的前后,组成一个词组后才能作句法成分或分句,比如介词、连词、助词、语气词都是这样的,这种词可以叫组合词;
极少数虚词不能跟其他词组合,只能单独作句子里的独立成分,这种词可以叫独立词,独立词只有叹词一个成员。
这样词在第一层次上可以分成实词和虚词两类,在第二层次上虚词可以分成组合词和独立词两类。实词能作句法成分,其中大多数实词能够单独成句,这种词可以叫自由词。
少数实词不能独立成句,这种词可以叫黏着词。
有的黏着词只能附着在其他词的前面,如数词、区别词和副词,可以叫前置词;
有的黏着词只能附着在其他词的后面,如方位词和量词,可以叫后置词。
自由词根据它们的优势分布又可以分为两类:一类经常作主语、宾语和定语,比如名词、时间词,可以叫体词;
一类经常作谓语、补语或状语,比如动词、形容词和状态词,可以叫谓词。
此外,代词也是自由词,它的语法功能很特别,它经常代替体词和谓词,行使体词和谓词作主语、宾语、定语或谓语、补语、状语的语法功能,但在分布上又受到一定的限制。为了跟代词相对待,体词和谓词可以合称为本词。
这样,在第二层次上实词可以分为自由词和黏着词两类,在第三层次上自由词可以分为本词和代词两类,黏着词可以分为前置词和后置词两类。在第四层次上本词分为体词和谓词两类,相应地代词分为体词性代词和谓词性代词两类。
词性分类
不管你选用什么分布特征作为分类标准,都很难做到真正地把属于同一类的词都划进来,把属于不同类的词都划出去。他指出,根源在于现在的词类划分基本上是以经典的范畴化理论为逻辑背景的。
这种追求简单、整齐的科学理想在实际的词类划分工作中往往行不通,因为
- 词类不完全是特征范畴,在很大程度上词类是原型范畴。
- 作为一种原型范畴,词类知识主要来源于人们对词和词之间在功能和意义上的家族相似性的概括:
- 其一是基于概念范畴的家族相似性,
- 其二是基于句法分布的位置相似性。
虽然语言学家的任务就是要根据明确的标准,用严格的方法来划分词类,说明不同类别的词在语法功能上的差异,所以语言学家划分出来的词类跟一般人常识中的词类可能不同,甚至很不相同。
但是,语言学家划分出来的词类不能从根本上否定一般人心目中的词类概念,即不能过分偏离说话人对于词类的语感。这跟生物学家对生物的分类不同,生物学家对生物的分类可以否定普通人常识中对生物的分类。
比如:
- 普通人认为鲸是鱼,所以称鲸为鲸鱼;
- 但是生物学家根据鲸是哺乳动物这一特征,可以判定鲸不是鱼。而语言学家却不能这样做。
因为普通人的词类概念来自词跟词之间的分布相似性,并且普通人的词类概念又会直接影响词在言语中的具体使用。
~ 以上笔记摘来下列书籍
- 《NLP汉语自然语言处理 原理与实践》- 郑捷
- 《认知语言学与汉语研究》- 吴为善
- 《认知语言学》- 王寅
- 现代汉语词性分类 冬梅老师 新浪博客
- created,170614