程春雷
- 作品数:22 被引量:62H指数:4
- 供职机构:江西中医药大学计算机学院更多>>
- 发文基金:国家自然科学基金博士科研启动基金江西省教育厅科学技术研究项目更多>>
- 相关领域:自动化与计算机技术医药卫生理学一般工业技术更多>>
- 中成药数据图谱可视化与知识问答平台研究被引量:5
- 2022年
- 中成药数据具有数量庞大、关系复杂等特点,如何对种类繁多的中成药临床、流通与标准规范数据进行有效存储、管理、跟踪与使用成为药品监管部门关注的重点。为实现中成药知识整合、提高数据关联性并挖掘数据的潜在价值,采用知识图谱存储结构结合可视化技术组织中成药临床技术、商业流通、标准规范等信息,构建中成药知识图谱数据库体系,搭建中成药知识图谱可视化平台。基于知识图谱技术的可视化平台能更好地挖掘中成药数据的潜在价值,而中成药知识图谱数据库可为智能问答研究提供数据基础,具有较好的知识服务前景。
- 周雪阳廖诗雨董泽华程春雷叶青
- 关键词:中成药知识图谱可视化
- 关系概念的Web文本主题抽取模型研究被引量:1
- 2016年
- Web文本主题抽取是文本分类与知识发现的研究热点,既有的抽取方法一般存在主题粒度确定、主题语义解释、新网络词汇识别等难题,限制了其在开放应用领域的使用效果.论文借助百度百科词条背景,基于关系概念的概念分层以及主题连通的思想,面向中文文本构建了关系概念主题抽取模型(relational concept topic model,RCTM),RCTM模拟人的概念局部识别,上下文语境理解的并行阅读方式,由此实现中文文本的主题抽取.RCTM中主题的表达相对独立、语义连通灵活,主题的描述具有更好的通用性与可解释性,为Web文本主题抽取提供了新的研究思路.实验表明,RCTM具有良好的主题抽取准确率,文本抽取出的主题词,简洁直观、可解释性好.针对开放的WEB文本,具有更好的通用性、稳定性.
- 程春雷夏家莉曹重华李光泉曹中华
- 关键词:文本主题抽取
- 电子病历命名实体识别研究进展被引量:4
- 2023年
- 电子病历命名实体识别(named entity recognition,NER)旨在识别电子病历文本中的医疗实体,并将其归为预定义的医疗实体类别,为进一步的医疗关系抽取、医疗信息检索、医疗智能问答等自然语言处理任务提供支持。系统梳理了电子病历命名实体识别的定义、标注方法、评价指标及难点;从电子病历命名实体识别难点及技术发展历程两个角度,综述了每类电子病历命名实体识别方法的优势与不足;详细梳理了国内医疗领域命名实体识别的评测任务及数据集;详细讨论和总结电子病历命名实体识别每一类难点的解决方案;总结全文并展望了医疗领域命名实体识别的发展方向。
- 刘安栋彭琳叶青杜建强程春雷查青林
- 关键词:自然语言处理电子病历命名实体识别
- 基于互联网模式下的中医药个体化智慧诊疗服务模式研究被引量:19
- 2022年
- 智慧医疗通过更深入的智能化、更全面的互联互通、更透彻的感知和度量,实现医生、患者以及各医疗机构之间的高度协作,达到医疗信息的高度移动与共享,真正实现“以患者为中心”的个体化治疗服务模式。从智慧医疗的概念及传统就医模式、医疗体系现状出发,针对中医药行业存在的共性问题,提出互联网模式下的中医药个体化智慧诊疗服务模式,阐述了互联网模式下的中医的基本特征概括为:以“辨证施治”为标志的人工智能系统、以“理法方药”为核心的制造大数据云平台、以“剂工质效”为重点的智能制造体系、以“个性定制”为特点的物联网平台和以“前店后坊”为模式的服务新业态,为进一步推进智慧医疗下的中医药个体化治疗服务模式建设提供参考。
- 林瑞华张雨恬王学成陈浩李远辉王雅琪熊旺平程春雷朱彦陈李智彪余瑛臧振中郑琴杜建强伍振峰杨明
- 关系概念的Web资源语义标识模型研究被引量:2
- 2016年
- Web环境下资源内容丰富,形式多样,描述标准不一,组织结构离散,既有标识方法存在语义单一,缺乏领域知识背景或人工参与度大等问题,限制了它们在个性化资源推荐和获取中的应用效果。基于关系概念的激活扩散以及资源分层语义标识的思想,面向Web资源构建了关系概念语义标识模型(relational concept annotation model,RCAM)。RCAM模拟人类记忆激活扩散过程,考虑记忆的加强与遗忘机制,由此实现资源更为动态、个性化的关联组织。RCAM中资源标识以关系概念作为语义要素,以片段关系概念集为语义模式,标识粒度灵活,语义逻辑相对完整,为Web资源标识组织提供了新的研究思路。实验表明,RCAM能提供更多的领域知识背景,可适应不同学习情景、学习个性下的资源动态组织,并且针对开放的Web资源,具有更好的通用性、扩展性。
- 程春雷夏家莉
- 中医诊断古文的词性标注与特征重组被引量:11
- 2015年
- 中医诊断古文存在大量单音词,使用通用切词技术处理,结果是单个的分词结果,不能构成一个完整的诊断词汇。对此,设计一个基于键值对模型的中医诊断词性标记集,提出基于词汇联系的隐马尔可夫模型(HMM),进行词性标注,结合词法分析,采用移进归约算法进行特征重组,生成中医诊断词汇。实验结果表明,改进的HMM的词性标注准确率在训练集和测试集中分别提高了2.58%和1.02%,特征重组结果是完整独立的诊断词汇,方便中医人员进行诊断分析,适合构成向量空间模型的特征。
- 王国龙杜建强郝竹林程春雷蔡良俊张鑫
- 关键词:隐马尔可夫模型词性标注
- 融合知识图谱的多通道中医辨证模型被引量:10
- 2022年
- 中医辨证是中医临床立法、处方、用药的基础和前提。中医电子病历缺乏高质量语料,模型训练容易欠拟合,且四诊信息的症状表达形式存在较大差异,限制了网络模型对复杂症状的识别能力。针对上述问题,通过对四诊信息多通道的分开处理,以及人工构建的小规模知识图谱对模型训练进行知识的增强,提出了融合知识图谱的多通道中医辨证模型。实验结果表明,基于中医电子病历数据集,提出的模型在P@1指标、P@3指标、P@5指标上相比基线模型分别提高3.51%、3.38%、3.32%,相比其他网络结构模型也有不同程度的提高,验证了所提模型对中医辨证具有显著效果。
- 叶青张素华程春雷邹静彭琳
- 关键词:中医辨证多通道中医电子病历
- 谓词概念连通度的中文实体关系抽取策略被引量:1
- 2014年
- 中文实体关系抽取是开放域文本检索与知识发现的研究热点,传统的抽取策略普遍存在人工标注量大,模式通用性受限,关系抽取粒度相对固定等问题,限制了其在开放领域的关系抽取效果。基于概念的结构分层和关系连通,面向中文实体关系构建了谓词概念模型(predicate concept model,PCM),在此基础上,提出了增量学习的谓词概念获取策略PCIA和基于谓词概念连通的关系抽取策略PCCS,由此进行了开放域非紧密的、远距离实体关系的抽取。各谓词概念的构建相对独立,概念组合更为灵活,对关系的描述具有更好的通用性和可解释性,为开放域未知关系的识别与抽取提供了有效手段。实验结果表明,PCCS有效提升了中文实体识别及实体连通路径选择的质量,获得了良好的关系抽取性能。
- 夏家莉程春雷陈辉曹重华李光泉
- 中文文本拼写纠错研究综述
- 2025年
- 中文文本拼写纠错(Chinese Spelling Correction,CSC)在自然语言处理(NLP)领域中是一个关键的基础任务,可为其下游任务和研究提供支持。CSC任务领域的研究持续发展,主要分为基于N-Gram语言模型、深度学习和大语言模型的纠错方法。首先对N-Gram语言模型的特性和在中文拼写纠错中的应用进行了分析,揭示了其在捕捉上下文信息方面的优势。其次基于深度学习的方法通过深度神经网络提高了纠错的准确性,并被广泛应用于中文文本处理中。同时,大语言模型的兴起为拼写纠错提供了新的思路,展示了其在处理复杂语言现象中的巨大潜力。该综述对中文文本拼写纠错领域的研究现状进行了详细的阐述,为从事相关研究人员提供参考。
- 沈友志程春雷句泽东龚著凡
- 关键词:中文文本N-GRAM语言模型
- 基于异构图表示的中医电子病历分类方法
- 2024年
- 中医(TCM)电子病历由于结构复杂多样与诊疗术语不规范的特点导致数据挖掘难度大、利用率低、难以抽取到有效信息。针对上述问题,提出基于LERT(Linguistically-motivated bidirectional Encoder Representation from Transformer)预训练模型与图卷积网络(GCN)并用异构图表示的中医电子病历分类模型TCM-GCN,用于改善中医电子病历特征有效表征的提取与分类。首先,利用LERT层词嵌入的方式将病历转换为句向量融入异构图中,以补全图结构缺失的病历整体语义特征;随后,为了缓解中医电子病历结构特点对特征提取产生的负面影响,异构图将关键词加入节点,使用BM25与点间互信息(PMI)算法构建图中“病历-关键词”“关键词-关键词”的边以表达病历的特征;最后,TCM-GCN依靠LERT-BM25-PMI构建的异构图对病历之间的特征关系进行聚合与抽取,完成病历分类的任务。在中医电子病历数据集上的实验结果表明,相较于次优的LERT,TCM-GCN加权平均后的准确率、召回率、F1值分别提升了2.24%、2.38%、2.32%,验证了算法在捕捉病历间隐含特征与中医电子病历分类工作上的有效性。
- 王楷天叶青程春雷
- 关键词:文本分类自然语言处理中医电子病历