孙媛媛
- 作品数:51 被引量:93H指数:5
- 供职机构:大连理工大学更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术政治法律经济管理社会学更多>>
- 基于刑事Electra的编-解码关系抽取模型被引量:1
- 2022年
- 针对司法领域关系抽取任务中模型对句子上下文理解不充分、重叠关系识别能力弱的问题,提出了一种基于刑事Electra(CriElectra)的编-解码关系抽取模型。首先,参考中文Electra的训练方法,在1000000份刑事数据集上训练得到了CriElectra;然后,在双向长短期记忆网络(BiLSTM)模型上加入CriElectra的词特征进行司法文本的特征提取;最后,通过胶囊网络(CapsNet)对特征进行矢量聚类,从而实现实体间的关系抽取。实验结果表明,在自构建的故意伤害罪关系数据集上,与基于中文Electra的这一预训练语言模型相比,CriElectra在司法文本上的重训过程使得学习到的词向量蕴含更丰富的领域信息,且F1值提升了1.93个百分点;与基于池化聚类的模型相比,CapsNet通过矢量运算能够有效防止空间信息丢失,并提高重叠关系的识别能力,使得F1值提升了3.53个百分点。
- 王小鹏孙媛媛林鸿飞
- 关键词:司法领域关系抽取
- 一种面向证据关联分析的知识图谱自动构建方法
- 本发明涉及一种知识图谱自动构建方法,一种面向证据关联分析的知识图谱自动构建方法,包括以下步骤:步骤1、构建本体对知识图谱进行描述,步骤2、抽取涉案证据,步骤3、抽取案件结构元,步骤4、建立证据与案件结构元之间的证明关系,...
- 孙媛媛宋文辉
- 一种基于网络直径的重要节点搜索方法
- 本发明涉及一种重要节点搜索方法,一种基于网络直径的重要节点搜索方法,包括以下步骤:1、选择合适数据结构存储网络,2、定义变量,并对变量进行初始化,3、层次遍历存储层次信息,4、根据层次信息找出中间层节点,5、根据中间层节...
- 关雅文孙媛媛 闫俊东
- 混凝土建筑结构蓄热对室内热环境的影响研究
- 随着供热和空调能耗在国民生产总能耗中所占的比率逐渐增大,各国越来越重视建筑节能的问题。蓄热是被动式太阳能建筑的三大要素之一,良好的热存储技术和系统设计能有效的降低建筑能耗。我国目前的建筑以混凝土结构为主,混凝土作为一种热...
- 孙媛媛
- 关键词:室内热环境建筑能耗混凝土结构
- 基于联合学习的司法知识图谱构建方法
- 本发明涉及一种司法知识图谱构建方法,一种基于联合学习的司法知识图谱构建方法,包括以下步骤:(1)构建刑事司法领域本体,(2)搭建Seq2Seq神经网络模型,(3)提取犯罪情节三元组,(4)存储于图数据库。本发明一种基于联...
- 孙媛媛陈彦光刘海顺
- 融入知识图谱和课程学习的对话情绪识别被引量:2
- 2024年
- 对话领域情绪识别是基于对话的情感分类任务,对话数据具有口语化、主题跨度大和标签具有语义相似性的特点.口语化表现为对话中存在隐含常识和语法知识的二义性词语和省略句,导致模型难以准确建模语义信息;主题跨度大表现为不同对话场景下的文本信息丰富度差异大、情绪转移频率差异大,导致模型性能下降.提出CK-ERC模型缓解上述问题,在预训练阶段,抽取结构化数据为模型融入常识和语法知识图谱,帮助模型建模口语化信息;在微调阶段引入监督对比学习任务帮助模型识别相似情绪标签;在训练策略上设计了基于动态阈值的课程学习策略,按照文本丰富度从高到低、情绪转移频率从低到高的策略优化模型.CK-ERC模型在双人对话、多人对话、模拟对话、日常对话等多种对话模式下显著优于其他模型,在MELD和EmoryNLP数据集上获得最佳表现.
- 杜金明孙媛媛林鸿飞杨亮
- 关键词:知识图谱课程学习
- 基于预训练语言模型的案件要素识别方法被引量:7
- 2021年
- 案件要素识别指将案件描述中重要事实描述自动抽取出来,并根据领域专家设计的要素体系进行分类,是智慧司法领域的重要研究内容。基于传统神经网络的文本编码难以提取深层次特征,基于阈值的多标签分类难以捕获标签间的依赖关系,因此该文提出了基于预训练语言模型的多标签文本分类模型。该模型采用以Layer-attentive策略进行特征融合的语言模型作为编码器,使用基于LSTM的序列生成模型作为解码器。在"CAIL2019"数据集上进行实验,该方法比基于循环神经网络的算法在F_(1)值上平均可提升7.4%,在相同超参数设置下宏平均F_(1)值比基础语言模型(BERT)平均提升3.2%。
- 刘海顺王雷孙媛媛陈彦光张书晨林鸿飞
- 基于毒品案件法律文书的实体及关系联合抽取方法
- 本发明涉及一种实体及关系的联合抽取方法,一种基于毒品案件法律文书的实体及关系联合抽取方法,包括以下步骤:(1)建立数据集,(2)搭建联合抽取模型,(3)训练联合抽取模型,(4)测试联合抽取模型,(5)结果讨论,(6)封装...
- 孙媛媛宋文辉陈彦光
- 基于双层模型体系的无线传感器网络的二次分簇算法
- 本发明属于无线传感网技术领域,提供基于双层模型体系的无线传感器网络的二次分簇算法,本发明主要在预测模型构建、邻近节点数据相关性检测两个方面,对传统的二次分簇算法进行改进,使用新的模型构建以及数据相关性检测方法。主要包括利...
- 刘凯王凡孙媛媛
- 基于对抗迁移学习的盗窃案件法律文书命名实体识别方法
- 本发明涉及一种法律文书命名实体识别方法,一种基于对抗迁移学习的盗窃案件法律文书命名实体识别方法,包括以下步骤:(1)构建法律命名实体数据集,(2)搭建对抗迁移学习神经网络模型,(3)测试模型,(4)结果讨论。本发明方法切...
- 孙媛媛李春楠许策王小鹏