《信息处理用现代汉语词类标记规范》发布出版
作者: 阅读数:
5120 发布时间:2018-03-27
教育部、国家语言文字工作委员组织研制的语言文字信息处理国家标准《信息处理用现代汉语词类标记规范》,由国家质量监督检验检疫总局、国家标准化管理委员会于2006年9月18日发布,自2007年3月1日实施。 该标准由教育部语言文字信息管理司提出立项,由教育部语言文字应用研究所计算语言学研究室承担,在国家社科基金“十五”重大项目《信息处理用现代汉语词汇研究》子课题研究的基础上完成。 词类标记是自然语言处理的基础环节。我国在词性标注方面作了不少研究,但各个系统的词类标记不统一,造成了信息交换、共享的困难。汉语语料库的深加工和汉语句法自动分析等自然语言处理领域,迫切需要制定《信息处理用现代汉语词类标记规范》,提供一套面向信息处理的、统一的现代汉语词类标记代码体系,以降低数据转换的代价。 该标准规定了信息处理中现代汉语词类及其他切分单位的标记代码,适用于汉语信息处理,也可供现代汉语教学与研究者参考。该标准为现代汉语词类问题的深入研究留下了空间。 该标准的发布,将促进汉语信息处理系统词类标记的标准化,有利于语言资源的信息交换与共享。 该标准已由中国标准出版社于2007年3月出版发行。 来源:《语言文字周报》
上一篇:语言立法与语言政策
下一篇: 国家语委汉语言文字规范标准项目