辽宁省教育厅高等学校科学研究项目(L2012345)
- 作品数:2 被引量:19H指数:2
- 相关作者:李舒吴磊更多>>
- 相关机构:辽宁中医药大学中国医科大学更多>>
- 发文基金:辽宁省教育厅高等学校科学研究项目更多>>
- 相关领域:医药卫生更多>>
- 中医方剂数据库文本挖掘数据预处理的尝试被引量:6
- 2015年
- 目的针对中医方剂数据挖掘需要提出一套以数据清洗为主的数据预处理方法,使数据规范、准确和有序,利于后续处理。方法通过检索技术,在方剂数据库中获取文本数据源,将非规范化的数据通过辅助词群行处理、正则表达式替换、异名处理等步骤进行清洗,改进数据质量。结果在中国方剂数据库共检索到1758条记录,在方剂现代应用数据库共检索到91条记录。源文本数据经预处理后共得到有效记录6913味药,可成功导入相关信息挖掘系统进行方剂名称和中药名词的信息抽取。结论本方法适用于基于中医方剂数据库的文本挖掘和知识发现,可成功对源文本数据实施清洗,得到标准统一、无噪声的数据,实现所需方药信息的有效抽取,可为中医方剂文本型数据信息分析与挖掘研究提供有益的借鉴。
- 吴磊李舒
- 关键词:中医方剂文本挖掘数据预处理数据清洗
- 基于双向聚类方法的中医治疗中风病方剂配伍规律知识发现被引量:13
- 2013年
- 目的深入探索方剂的制方要素,总结方药证治规律,找到对其中药理起关键作用的核心药/药组,为方剂配伍理论研究、药性理论研究、中医临床用药研究提供新方法和现代技术手段。方法从《中国方剂数据库》和《方剂现代应用数据库》中获取治疗中风病的方药文本数据源,经预处理、信息抽取后构建方药矩阵,引入双向聚类方法对方-药两方面数据同时聚类。结果预处理后得到有效记录648首,共计6913味药,生成了100×648"方-药"矩阵,最后得到4组聚类指标,高描述度代表方共8首,总结出针对不同证型配伍用药特点及各证型辨证论治的治则治法及各型常用药对药组。结论本方法适用于中医方剂数据库中方-药知识发现,可有效抽取所需方药信息,梳理出方药证治规律。
- 吴磊李舒
- 关键词:中风方剂配伍知识发现