罗远胜 作品数:16 被引量:44 H指数:5 供职机构: 江西财经大学 更多>> 发文基金: 国家自然科学基金 江西省教育厅科学技术研究项目 江西省自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
多校区教学管理信息系统 肖华茵 季小刚 罗远胜 李跃林 张鹏 王昊 徐世亮 肖敏 黄剑 万维 刘臻辉 胡丽平 符刚 贺东风 范爱华 随着高等教育的规模迅速扩大和各高等院校的合并调整,原先传统的、百线式的单一校区教学管理模式已不能适应多校区教学管理的需要。多校区办学是高校事业发展过程中出现的新生事物,在新的多校区办学条件下,资源整合、管理体制、学科体系...基于团模型的文档重排算法研究 被引量:2 2009年 为了满足用户对信息检索结果准确不断提高的需求,尽可能应用那些与查询及检索结果有关的信息进行查询结果优化是一种有效的手段。查询扩展和结果重排就是利用附加信息进行检索结果优化的方法。该文提出了基于文档团的文档重排模型(DCRM模型),此模型通过对文档集的学习,构造文档与文档关系的Markov网络,提取出文档Markov网络中的"文档团",应用文档团信息进行文档重排。在adi、cacm、med、cisi和cran五个数据集上的实验结果表明,本文提出的基于文档团的文档重排模型较BM25模型性能得到有效提高。 付剑波 王明文 罗远胜 张华伟关键词:计算机应用 中文信息处理 MARKOV网络 双语潜在语义对应分析及在跨语言文本分类中的应用研究 被引量:2 2013年 双语文本对应分析在处理多语言文本数据、克服语言障碍等方面有着重要的作用,基于语料库技术的跨语言潜在语义索引方法没有充分考虑双语的语义相关性。本文将双语平行文档看作同一语义内容的两种语言表达,运用偏最小二乘方法构建双语文本的语义相关性,为每种语言建立单独的潜在语义空间,并在这两个空间上实现跨语言的分类任务。在香港政府网中英双语新闻的实验结果显示,本文方法构造的双语潜在语义空间上完成的跨语言和单语言文本分类性能接近或优于原始特征空间的单语言分类,并具有良好的稳健性。 罗远胜 王明文 勒中坚 陆旭关键词:偏最小二乘 基于PLS的文本分类技术研究 近年来,随着网上电子文档的数量以指数级的速度增长,文本分类技术在信息检索、信息过滤以及内容管理等各项应用中变得越来越重要,已经成为信息检索和机器学习中的前沿研究领域。自动文本分类是指在给定的分类体系下,对未知类别的文档进... 罗远胜关键词:文本分类 偏最小二乘回归 核方法 维数约减 特征抽取 文献传递 基于核方法的潜在语义文本分类模型 在信息检索中,潜在语义索引模型直接应用于文本分类时,由于对分类贡献大的特征可能丢失而效果不佳.而考虑了文本特征及分类信息的潜在语义文本分类模型(LSC)也因为本质上是线性模型而性能不高.为了提高分类性能,通过引入核函数,... 罗远胜 王明文 曾雪强关键词:文本分类 核方法 偏最小二乘 核偏最小二乘 文献传递 一种基于簇相合性的文本增量聚类算法 被引量:2 2014年 传统文本聚类方法只适合处理静态样本,且时间复杂度较高。针对该问题,提出一种基于簇相合性的文本增量聚类算法。采用基于词项语义相似度的文本表示模型,利用词项之间的语义信息,通过计算新增文本与已有簇之间的相合性实现对文本的增量聚类。增量处理完部分文本后,对其中错分可能性较大的文本重新指派类别,以进一步提高聚类性能。该算法可在对象数据不断增长或更新的情况下,避免大量重复计算,提高聚类性能。在20 Newsgroups数据集上进行实验,结果表明,与k-means算法和SHC算法相比,该算法可减少聚类时间,提高聚类性能。 陶舒怡 王明文 万剑怡 罗远胜 左家莉关键词:文本聚类 增量聚类 语义相似度 融合多元用户特征和内容特征的微博谣言实时检测模型 被引量:5 2022年 针对目前基于单文本语义特征深度学习的微博谣言实时检测模型泛化能力不足的问题,提出一种融合多元用户特征和内容特征的实时检测模型.首先,在传统用户基本特征和内容统计特征的基础上,利用用户的历史行为数据,挖掘用户理性值和用户专业度两个深层次特征;然后,基于词向量和带有注意力机制的双向GRU神经网络构建文本语义特征学习模型;最后,采用分层特征级联和全连接的方式进行特征融合,把融合特征输入分类模型进行训练.实验结果表明,该模型的检测准确率达到了91.74%,相比其他只关注文本语义特征的深度学习实时检测模型具有更好的识别效果,相比于其他改进型的实时检测模型F1-Measure值也提高了2.19%. 黄学坚 王根生 王根生 罗远胜 吴小芳 李志鹏关键词:实时检测 Web挖掘中若干理论与算法研究 王明文 罗远胜 左家莉 万中英 王晓庆 廖海波 吴福英 万剑怡 因特网正在把全球的信息资源连接起来,形成了人类有史以来所面对的最巨大的信息海洋。但这些信息在给人们带来丰富信息资源的同时,也使人们陷入了所谓的“信息灾难”。信息过载几乎成为人人需要面对的问题。Web挖掘是从因特网中获取感...关键词:关键词:因特网 基于核方法的潜在语义文本分类模型 被引量:9 2005年 在信息检索中,潜在语义索引模型直接应用于文本分类时,由于对分类贡献大的特征可能丢失而效果不佳。而考虑了文本特征及分类信息的潜在语义文本分类模型(LSC)也因为本质上是线性模型而性能不高。为了提高分类性能,通过引入核函数,给出了一种非线性的潜在语义文本分类模型。该模型比LSC模型能更好地表示文档空间的潜在语义结构信息。在R eu ter-21578文档集上的实验结果表明,潜在语义文本分类模型有很好的分类性能。 罗远胜 王明文 曾雪强关键词:文本分类 核方法 潜在语义索引 跨语言信息检索中的双语主题相关模型 被引量:8 2013年 如何通过双语平行语料库提取语言之间的语义对信息,对改善跨语言信息检索的性能有着十分重要的意义.双语平行文档拥有相同的主题,这些双语主题在具体模型上可体现为语义相关.本文首先将双语平行文档看作同一语义内容的两种语言表示,从双语平行语料库构造每种语言的潜在语义空间,从而提出一种新的双语主题模型,即双语偏最小二乘主题相关模型.新模型克服了跨语言潜在语义索引模型没有充分考虑双语语义联系的不足.在中英双语新闻语料集上实验结果显示,新模型的文档配对搜索和伪查询跨语言检索性能明显优于跨语言潜在语义索引模型;在使用Google翻译得到的TREC-9双语平行语料库上,新模型也获得了较好的检索性能. 罗远胜 王明文 勒中坚 张华伟关键词:跨语言信息检索 主题模型