基于方剂数据的数据预处理工具研发

发布时间:2021-07-07 16:40:34    来源:

  

题目名称

基于方剂数据的数据预处理工具研发

作品形式

软件工具

题目要求

基于中国方剂数据库提供的万余条数据,进行方剂数据术语管理工具的研发。

要求1:针对中国方剂数据库所提供的数据特点进行研发。

要求2:软件需要可以对所提供的数据资源以及此类数据进行数据预处理,例如对中药名称、功效、主治症状等进行数据预处理,能相对准确的去掉干扰数据,识别相同含义数据,区分相似数据,工具可以将数据进行准确的切分词、分类以及词语正名和异名的自动转化,即将文本里的异名自动规范为正名,软件需要用户可以配置和管理。

要求3:数据预处理工具具备编辑、导入、导出和词表管理功能。

要求4:预处理工具简单便捷,可以单机安装,最好可以嵌入其他系统和平台。

关联数据资源

方剂数据

是否为往届题目

出题单位

中国中医科学院中医药信息研究所

联系人

王静

联系电话

010-64089610

联系邮箱

Cintcm2012@163.com

 

评审标准——软件工具类

分类

具体要求

分值

功能

60分)

开发对方剂相关数据进行数据预处理的软件,可以对所提供的数据资源以及此类数据进行数据预处理,例如对方剂名称、中药名称、功效、治法、症状等进行预处理,能相对准确的去掉干扰数据,识别相同含义数据,区分相似数据,软件需要用户可以配置和管理。

例如,导入一条方剂信息,经过软件预处理后,导出的方剂信息应该在保留原有信息的基础上,每项多出一列处理规范后的数据。中药可以参考《中国药典2015版》,可以去剂量规范,也可以规范剂量描述,如剂量大小写规范;症状需要在现有主治文本描述中先自动切词,再根据专业知识制定处理标准,将含义相似的数据进行规范化处理;。

30

数据预处理工具具备编辑、导入、导出和词表管理功能。

20

预处理工具简单便捷,可以单机安装,最好可以嵌入其他系统和平台。

10

创意

10分)

数据预处理方法具有特色,区分一般基本匹配方法

10

界面

20分)

界面简单明了

5

界面友好性强

10

界面外观美观

5

文档

10分)

文档资料全面,规格需求说明书和操作手册以及配置说明都具备

10

合计

100分)