方全
- 作品数:33 被引量:48H指数:4
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家自然科学基金国家科技攻关计划北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术机械工程航空宇航科学技术理学更多>>
- 问题加注标签方法、装置、电子设备和存储介质
- 本发明提供一种问题加注标签方法、装置、电子设备和存储介质,其中方法包括:获取目标问题和标签集合,标签集合内包含多个候选标签;对目标问题和各候选标签分别进行特征提取,得到目标问题的问题语义特征和各候选标签的标签语义特征;基...
- 徐常胜许诺佳钱胜胜方全胡骏
- 基于对偶变分多模态注意力网络的不完备社会事件分类方法
- 2022年
- 互联网的快速发展和社交媒体规模的不断扩大,带来丰富的社会事件资讯,社会事件分类任务越来越具有挑战性。充分利用图像级和文本级信息是社会事件分类的关键所在。然而,现存的方法大多存在以下局限性:1)现有的多模态方法大多都有一个理想的假设,即每种模态的样本都是充分和完整的,但在实际生活应用中这个假设并不总是成立,会存在事件某个模态缺失的情况;2)大部分方法只是简单地将社会事件的图像特征和文本特征串联起来,以此得到多模态特征来对社会事件进行分类,忽视了模态之间的语义鸿沟。为了应对这些挑战,提出了一种能同时处理完备与不完备社会事件分类的对偶变分多模态注意力网络(DVMAN)。在DVMAN网络中,提出了一个新颖的对偶变分自编码器网络来生成社会事件的公共表示,并进一步重构不完备社会事件学习中缺失的模态信息。通过分布对齐和交叉重构对齐,对图像和文本潜在表示进行双重对齐,以减小不同模态之间的差距,并对缺失的模态信息进行重构,合成其潜在表示。除此之外,设计了一个多模态融合模块对社会事件的图像和文本细粒度信息进行整合,以此实现模态之间信息的互补和增强。在两个公开的事件数据集上进行了大量的实验,与现有先进方法相比,DVMAN的准确率提升了4%以上,证明了所提方法对于社会事件分类的优越性能。
- 周旭钱胜胜李章明方全徐常胜
- 关键词:多模态社交媒体
- 热点话题检测方法及装置
- 本发明涉及计算机技术领域,具体涉及一种热点话题检测方法。本发明的热点话题检测方法包括:基于预设实体知识库提取目标文本的关键句作为目标文本的摘要;使用LSH算法计算摘要的文档指纹;基于KNN算法对文档指纹进行聚类分析以确定...
- 徐常胜方全李泳锡
- 基于知识图谱的用户建模方法、序列推荐方法
- 本发明属于用户建模与推荐系统领域,具体涉及一种基于知识图谱的用户建模方法、序列推荐方法,旨在为了解决现有用户建模方法无法有效提取用户动态访问信息的特征,准确捕捉用户兴趣;现有序列推荐系统推荐准确率不高,用户体验较差的问题...
- 徐常胜黄晓雯方全钱胜胜桑基韬
- 虚假新闻检测方法、装置、电子设备和存储介质
- 本发明提供一种虚假新闻检测方法、装置、电子设备和存储介质,所述方法包括:将待检测新闻数据输入至新闻检测模型中,得到新闻检测模型输出的新闻检测结果;其中,新闻检测模型用于提取待检测新闻数据的多个文本特征和图像特征,基于自注...
- 徐常胜 钱胜胜方全
- 基于有监督对比的跨模态检索方法、系统及设备
- 本发明属于跨模态检索领域,具体涉及了一种基于有监督对比的跨模态检索方法、系统及设备,旨在解决现有的监督式跨模态学习方法一般通过线性投影捕获数据相关性,且通常聚集于最大化成对相关性或分类准确性,InfoNCE损失平等对待所...
- 徐常胜钱胜胜方全
- 基于图对比注意力网络的知识图谱补全被引量:4
- 2022年
- 知识图谱(KG)补全旨在通过知识库中已知三元组来预测缺失的链接。由于大多数方法都是独立地处理三元组,而忽略了知识图谱所具有的异质结构和相邻节点中固有的丰富的信息,导致不能充分挖掘三元组的特征。考虑基于端到端的知识图谱补全任务,提出了一种图对比注意力网络(GCAT),通过注意力机制同时捕获局部邻域内实体和关系的特征,并封装实体邻域上下文信息。为了有效封装三元组特征,引入一个子图级别的对比训练对象用于增强生成的实体嵌入的质量。为了验证GCAT的有效性,在链接预测任务上评估了所提方法,实验结果表明,在数据集FB15k-237中,MRR比InteractE提高0.005,比A2N模型提高0.042;在数据集WN18RR中,MRR比InteractE提高0.019,比A2N模型提高0.032。实验证明提出的GCAT模型能够有效预测知识图谱中缺失的链接。
- 刘丹阳方全张晓伟胡骏钱胜胜徐常胜
- 关键词:链接预测
- 基于图对比的上下位关系检测被引量:1
- 2022年
- 上下位关系是自然语言处理(NLP)下游任务的基础,因此上下位关系检测是自然语言处理领域备受关注的问题。针对现有词嵌入方法采用随机初始化词向量,不能很好地捕获上下位关系不对称和可传递的特性,且现有模型没有充分利用预测向量与真实投影之间关系的局限性,提出了一种基于图对比学习的上下位关系检测(HyperCL)方法。引入图对比学习进行数据增强,基于最大化局部和全局表示的互信息,学习具有鲁棒性的词特征表示。所提方法学习了将下位词的词向量投影到上位词和非上位词,同时能够更好地区分嵌入空间中的上位词和非上位词,从而提高了检测精度。在2个基准数据集上的实验结果表明,所提模型比现有方法在准确率上提升了0.03以上。
- 张雅丽方全王允鑫胡骏钱胜胜徐常胜
- 命名实体识别方法、装置、电子设备及存储介质
- 本发明提供一种命名实体识别方法、装置、电子设备及存储介质,其中命名实体识别方法包括:获取待识别医学文本及与待识别医学文本关联的医学图像;将医学文本及医学图像输入至命名实体识别模型的编码器,得到多层文本编码特征及多层图像编...
- 徐常胜张凡李泳锡方全
- 文本链接嵌入方法
- 本发明涉及互联网文本分析技术领域,具体涉及一种文本链接嵌入方法,所述方法是根据预设的字符级特征向量进行向量拼接得出待检测文本的目标词条和知识实体库中实体的特征向量,然后计算实体和目标词条的特征向量相似度以找到与目标词条对...
- 徐常胜方全李泳锡