[关闭]
@Cesar 2017-12-21T06:33:33.000000Z 字数 3264 阅读 1924

CoreNlp标注含义

算法



POS(part-of-speech tagging)

In corpus linguistics, part-of-speech tagging (POS tagging or POST), also called grammatical tagging or word-category disambiguation, is the process of marking up the words in a text (corpus) as corresponding to a particular part of speech, based on both its definition, as well as its context —ie. relationship with adjacent and related words in a phrase, sentence, or paragraph. A simplified form of this is commonly taught to school-age children, in the identification of words as nouns, verbs, adjectives, adverbs, etc.

  1. 谓词性形容词:VA
    谓词性形容词大致上相当于英语中的形容词和中文语法中、文学作品里的静态动词。我们的谓词性形容词包括两类。
  2. 系动词:VC
    “是”和“为”被标记为VC。如果“非”的意思是“不是”并且句子里没有其他动词时,“非”也被标注为VC。
  3. “有”作为主要动词:VE
    只有当“有,没{有}”和“无”作为主要动词时(包括占有的“有”和表存在的“有”等等),被标注为VE。
  4. 其他动词:VV
  5. 专有名词:NR
  6. 时间名词:NT
  7. 其他名词:NN
  8. 方位词:LC
  9. 代词(1种):PN
  10. 限定词:DT
  11. 基数词:CD
  12. 序列词:OD
  13. 度量词:M
  14. 副词:AD
  15. 介词:P
  16. 并列连接词:CC
  17. 从属连词:CS
  18. “的”作为补语标记/名词化标记:DEC(的,之)
    注:的还有其他标记
    ·DEC 他的/DEG车
    ·SP 他是/VC一定要来的/SP。
    ·AS 他是/VC在这里下的/AS车。
  19. “的”作为关联标记或所有格标记:DEG
    模式:NP/PP/JJ/DT DEG{NP}。
  20. 补语短语 得:DER
    在V-得-R和V-得结构中,“得”标记为DER。
    注:有些以“得”结尾的搭配不是V-得结构,如记得,获得是动词。
  21. 方式“地”:DEV
    当“地”出现在“XP地VP”,XP修饰VP。在一些古典文学中,“的”也用于这种情景,此时“的”也标注为DEV。
  22. 动态助词:AS
    动态助词仅包括“着,了,过,的”。
  23. 句末助词:SP
    SP经常出现在句末,如:他好吧[SP]?
    有时,句末助词用于表停顿,如:他吧[SP],人很好。
    如:了,呢,吧,啊,呀,吗
  24. ETC
    ETC用于标注等,等等。
  25. 其他助词:MSP
  26. 感叹词:IJ
  27. 拟声词:ON
  28. 长“被”结构:LB
  29. 短“被”结构:SB(仅包括口语中的“被,给”)
  30. 把字结构:BA
  31. 其他名词修饰语:JJ
  32. 外来词:FW
  33. 标点:PU

Named Entity Recognition(命名实体识别)

识别名称(PERSON, LOCATION,ORGANIZATION,MISC),数字(MONEY,NUMBER,ORDINAL,PERCENT)和时间(DATE, TIME, DURATION, SET)实体。

  1. 人:Person:'ALL',
  2. 地点:Location:'ALL',
  3. 组织:Organization:'ALL',
  4. 杂项: Misc:'4class Only',
  5. 钱:Money:'7class Only',
  6. 数字:NUMBER
  7. ORDINAL:序数词
  8. PERCENT:百分比
  9. 日期:Date:'7class Only',
  10. 时间:Time:'7class Only'
  11. 持续:DURATION
  12. set

dependency parse(依存句法分析)

中心语为谓词

  1. Subg:主语
  2. nsubj:名词性主语(nominalsubject)(同步、建设)
  3. top:主题(topic)(是,建筑)
  4. npsubg:被动型主语(nomialpassivesubject),专指由“被”引导的被动句中的主语,一般是谓词词义上的受事(称作,镍)
  5. csubg:从句主语(clausal subject), 中文不存在
  6. xsubg:x主语,一般一个主语下面含多个从句(完善,有些)

中心语为谓词或介词

  1. Obj:宾语
  2. dobj:直接宾语(颁布、文件)
  3. iobj:间接宾语(indirect object),基本不存在
  4. range:间接宾语为数量词,又称为与格(成交,元)
  5. pobj:介词宾语(根据,要求)
  6. lobg:时间介词(来,近年)

中心语为谓词

  1. Comp:补语
  2. Ccomp:从句补语,一般由两个动词组成,中心语引导后一个动词所在的从句(IP)(出现,纳入)
  3. xcomp:x从句补语(xclausalcomplement),不存在
  4. acomp:形容词补语(adjectivalcomplement)
  5. tcomp:时间补语(temporalcomplement)(遇到,以前)
  6. lccomp:位置补语(localizercomplement)(占,以上)
  7. rscomp:结果补语(resultativecomplement)

中心词为名词

  1. mod:修饰语(modifier)
  2. pass:被动修饰(passive)
  3. tmod:时间修饰(temporalmodifier)
  4. rcmod:关系从句修饰(relativeclsuse modifier)(问题,遇到)
  5. numod:数量修饰(numericmodifier)(规定,若干)
  6. ornmod:序数修饰(numericmodifier)
  7. clf:类别修饰(classifiermodifier)(文件,件)
  8. nmod:复合名词修饰(noun compoundmodifier)(浦东,上海)
  9. amod:形容词修饰(adjetivemodifier)(情况,新)
  10. advmod:副词修饰(adverbialmodifier)(做到,基本)
  11. vmod:动词修饰(verb modifier, participlemodifier)
  12. neg:不定修饰(negativemodifier)(遇到,不)
  13. det:限定修饰(determinermodifier)(活动,这些)
  14. possm:所属标记(possessivemarker),NP
  15. poss:所属修饰(possessivemodifier),NP
  16. dvpm:DVP标记(dvp marker)DVP(简单,的)
  17. dvpmod:DVP修饰(dvpmodifier),DVP(采取,简单)
  18. assm:关联标记(associativemarker):DNP(开发,的)
  19. assmod:关联修饰(associativemarker),NP|QP(教训、特区)
  20. prep:介词修饰(prepositionalmodifier), NP/VP/IP(采取,对)
  21. clmod:从句修饰(clause modifier)(因为,开始)
  22. plmod:介词性地点修饰(prepositionallocalizer modifier)(在,上)
  23. asp:时态标词(aspect marker)(做到,了)
  24. partmod:分词修饰(participialmodifier)(不存在)

中心词为实词

  1. conj:联合(conjunct)
  2. cop:系动(copula),双指助动词
  3. cc:连词(coordination),指中心词与连词(开发,与)

其他

  1. attr:属性关系(是,工程)
  2. cordmod:并列联合动词(coordinatedverb compound)(颁布,实行)
  3. mmod:情态动词(modal verb)(得到,能)
  4. ba:“把”字关系
  5. tclaus:时间从句(以后,积累)
  6. cpm:补语化成份(complement),一般指“的”引导的CP(振兴,的)
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注