《中文信息学报》:中文组织机构名称与简称的识别

本文提出了一种基于规则识别中文组织机构全称和简称的方法。全称的识别首先借助机构后缀词库获得其右边界,然后通过规则匹配并借助贝叶斯概率模型加以决策获得其左边界。简称的识别是在全称的基础上应用其对应的简称规则实现的。在开放性测试中,该方法的总体查全率为85.19%,查准率为83.03%,FMeasure为84.10%;简称的查全率为67.18%,查准率为74.14%。目前该方法已应用于中文关系的抽取系统。
文件格式: PDF大小: 185.33KB页数: 5
点击进入文档下载页(PDF格式)
已到末页,全文结束
点击进入文档下载页(PDF格式)

您可能感兴趣的文档

最近文档浏览记录