赵红燕
- 作品数:17 被引量:37H指数:3
- 供职机构:太原科技大学更多>>
- 发文基金:山西省回国留学人员科研经费资助项目国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学矿业工程更多>>
- 基于HD-MSCNN的层次结构文本自动分类方法
- 本发明提供了一种基于HD‑MSCNN的层次结构文本自动分类框架,该分类框架主要包括四部分:(1)局部共享层;(2)粗粒度分类器C;(3)细粒度层分类器F<Sub>k</Sub>;(4)概率平均层;在分类器构建阶段采用基于...
- 谢斌红张英俊赵红燕潘理虎马非
- 基于DNN的汉语框架识别研究被引量:5
- 2016年
- 框架识别是语义角色标注的基本任务,它是根据目标词激起的语义场景,为其分配一个合适的语义框架。目前框架识别的研究主要是基于统计机器学习方法,把它看作多分类问题,框架识别的性能主要依赖于人工选择的特征。然而,人工选择特征的有效性和完备性无法保证。深度神经网络自动学习特征的能力,为我们提供了新思路。该文探索了利用深度神经网络自动学习目标词上下文特征,建立了一种新的通用的框架识别模型,在汉语框架网和《人民日报》2003年3月新闻语料上分别取得了79.64%和78.58%的准确率,实验证明该模型具有较好的泛化能力。
- 赵红燕李茹张晟张力文
- 基于分层学习的易混淆法条预测被引量:3
- 2020年
- 目前针对法条预测的相关研究大都采用文本分类的思想,但模型构建过程都未考虑不同法条之间的从属关系或相似程度,因此对于易混淆法条预测效果普遍较差。针对现有方法在易混淆法条预测中存在的不足,提出基于分层学习的易混淆法条预测方法。将法条分为易区分法条和易混淆法条,按法条内容将易混淆法条组合为不同易混淆法条集并分别训练易混淆法条集预测模型,运用分层学习完成易混淆法条预测。在刑事案件的数据上进行实验,实验结果表明,该模型能较好解决易混淆法条预测问题,提高法条预测准确率。
- 程豪张虎崔军赵红燕谭红叶李茹
- 关键词:文本分类
- 疫情期间的计算机网络线上教学模式被引量:7
- 2021年
- 针对疫情期间的计算机网络课程教学,提出采用超星学习通构建SPOC课程+腾讯会议直播平台答疑讨论+企业微信群师生互动的翻转课堂线上教学模式。阐述实施过程中的具体措施,强调对于重要知识点采取“一人一题”和“一题一策”的测试方法,分析学生的学习特点,以提高学生在疫情特殊时期的学习效果。
- 刘爱琴荀亚玲胡立华张素兰张继福赵红燕
- 关键词:计算机网络线上教学
- 基于集成学习方法的实体关系抽取
- 2021年
- 基于神经网络的实体关系抽取模型已经被证明了它的有效性,但使用单一的神经网络模型在不同的输入条件下,会表现出不同的结果,性能不太稳定.因此本文提出一种利用集成学习思想将多个单一模型集成为一个综合模型的方法.该方法主要使用MLP (MultiLayer Perceptron)将两个单一模型Bi-LSTM (Bi-directional Long ShortTerm Memory)和CNN (Convolutional Neural Network)集成为一个综合模型,该模型不仅可以充分利用两个单一模型的优势,而且可以利用MLP的自学习能力与自动分配权重的优势.本研究在SemEval 2010 Task 8数据集上取得了87.7%的F1值,该结果优于其他主流的实体关系抽取模型.
- 丰小丽张英俊谢斌红赵红燕
- 关键词:实体关系抽取CNNMLP
- 基于BSTTC模型的中文命名实体识别被引量:3
- 2021年
- 大多数中文命名实体识别模型中,语言预处理只关注单个词和字符的向量表示,忽略了它们之间的语义关系,无法解决一词多义问题;Transformer特征抽取模型的并行计算和长距离建模优势提升了许多自然语言理解任务的效果,但全连接结构使得计算复杂度为输入长度的平方,导致其在中文命名实体识别的效果不佳.针对这些问题,提出一种基于BSTTC (BERT-Star-Transformer-TextCNN-CRF)模型的中文命名实体识别方法.首先利用在大规模语料上预训练好的BERT模型根据其输入上下文动态生成字向量序列;然后使用星型Transformer与TextCNN联合模型进一步提取句子特征;最后将特征向量序列输入CRF模型得到最终预测结果.在MSRA中文语料上的实验结果表明,该模型的精确率、召回率和F1值与之前模型相比,均有所提高.与BERT-Transformer-CRF模型相比,训练时间大约节省了65%.
- 申晖张英俊谢斌红赵红燕
- 关键词:命名实体识别条件随机场
- 改进最大Lyapunov指数的多变量瓦斯浓度预测研究被引量:1
- 2016年
- 煤矿井下瓦斯浓度受到多个环境参数的影响。首先对煤矿井下同一时间段的瓦斯浓度、风速、压力、温度、CO2、O2的时间序列数据进行统计学相关性分析,选择出对瓦斯浓度影响大的几种因素,并作为基于最大Lyapunov指数改进预测模型的输入参数来预测未来一段时间的瓦斯浓度。改进算法为:在用C-C方法重构多变量时间序列的相空间和Wolf方法计算最大Lyapunov指数的基础上,同时考虑夹角余弦和欧氏距离求取预测中心点的相近点。结果表明,改进预测算法提高了预测精度,平均绝对误差和标准差分别为2.11%和2.15%。
- 张欣雨李茹高俊杰王浩王晋宇赵红燕
- 基于词语语义差异性的多标签罪名预测被引量:3
- 2019年
- 罪名预测是智慧司法领域中的一项重要研究内容,其旨在依据犯罪事实自动预测出犯罪主体触犯的罪名。犯罪事实是案件的真实客观描述,犯罪事实中各词语的语义重要性在不同罪名的判决中有所差异,而现有方法在对犯罪事实建模的过程中往往忽略了这种语义差异性,且缺乏对数罪并罚情形的处理。为此,该文在对犯罪事实的建模过程中将词语的语义差异融入注意力机制;并将数罪并罚情形下的多标签罪名预测转化为多个独立的单标签罪名预测。实验结果表明,该文基于词语语义差异性建模和多标签转化策略均有利于提升罪名预测的效果,在“中国法研杯”2018司法人工智能挑战赛公布的数据集上达到了88.0%的F1值。
- 王加伟张虎谭红叶王元龙赵红燕李茹
- 多特征文本蕴涵识别研究被引量:3
- 2014年
- 文本蕴涵识别是解决自然语言中存在的同义异形问题的有效途径。虽然国内外学者已经提出了很多文本蕴涵识别模型,但影响文本蕴涵识别的因素错综复杂,识别准确率普遍不高。该文把文本蕴涵识别看作二元分类问题,抽取词汇特征、句法依存关系特征及FrameNet语义知识库特征的多种特征构造特征矩阵,训练SVM分类器,实现文本蕴涵识别。该方法在国际文本蕴涵识别技术评测RTE3的测试集上进行测试,蕴涵正例识别准确率达到了78.1%,高于RTE3评测2-ways的最高结果。
- 赵红燕刘鹏李茹王智强
- 关键词:FRAMENET
- 科学数据共享平台关键技术及应用研究
- 陈立潮侯红串谢斌红张英俊王江梁国琴仇建平赵红燕王剑锐赵淑芳王秀慧王新波赵勇赵治军武经宇吴景红
- 该项目针对科学数据共享中的共享标准体系、数据资源整合、平台的设计与实现和服务模式等几个关键技术进行了深入研究,提出了有效的解决方案与方法,对科学数据共享平台的建设具有重要的意义。在理论研究方面,针对元数据汇交和收割过程中...
- 关键词:
- 关键词:科学数据共享平台