宋威
- 作品数:41 被引量:161H指数:8
- 供职机构:江南大学物联网工程学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学理学更多>>
- 融合用户信任度与相似度的推荐算法研究被引量:10
- 2018年
- 提出一种新的基于概率矩阵分解的推荐算法.首先,对用户之间的信任关系网络进行重构,突出社交网络中被很多用户信任的用户地位.其次,引入用户之间的相似度,区分目标用户与其信任用户之间的兴趣偏好.最后,运用信任关系与相似度获取用户之间的加权关系,从而得到融合用户信任度与相似度的推荐算法.实验采用Ciao数据集,其结果表明所提出的算法在平均绝对误差和均方根误差这两个推荐准确性指标上都有较大的提高.
- 徐毅叶卫根戴鑫宋威周贤泉
- 关键词:推荐系统信任关系
- 一种改进的蝙蝠算法被引量:6
- 2019年
- 为了增强蝙蝠算法的全局寻优能力,提出一种新的全局“寻优策略”,将蝙蝠个体历史最优引入到蝙蝠个体寻优策略中,并引入一种“指引”方向指导蝙蝠个体全局寻优。蝙蝠个体每次迭代后将执行“优胜劣汰”的策略,随机初始化一些蝙蝠个体取代那些适应度值较低的个体,增加种群多样性以防止陷入局部极值。选取UCI中的Iris,Wine,Sonar数据集用来聚类测试,实验结果表明:与原始蝙蝠算法、差分进化算法、粒子群算法相比,改进的蝙蝠算法能够得到更高的聚类准确率,鲁棒性更强。
- 周贤泉宋威张士昱王晨妮
- 关键词:全局寻优
- 一种处理不平衡大数据的并行随机森林算法被引量:8
- 2017年
- 基于MapReduce机制的并行随机森林算法MR_RF在处理不平衡大数据时,由于数据本身正类密度低且算法又以全局最优标准选择分割点,而导致正类有误分为负类的趋势,降低了分类效率.本文提出了一种改进的并行随机森林算法(SBWMR_RF),该算法利用分层自助抽样方法增大对少数类的抽样数量,同时考虑正负类不同的误分代价,动态计算每个分区的代价敏感矩阵,将其引入到构建基分类器的关键步骤,弱化数据偏置的影响.实验证明SBWMR_RF算法提高了对不平衡大数据的分类准确率,没有出现过拟合现象,在极不平衡环境下优势明显.
- 秦静钱雪忠王卫涛谢国伟宋威
- 关键词:MAPREDUCE
- 基于像素差分基元矩阵的图像检索被引量:4
- 2015年
- 针对图像检索问题,提出一种基于像素差分基元矩阵的图像检索方法。该方法结合图像的颜色特征与纹理特征,在量化后的HSV颜色空间中提出10种基元;通过定义的基元扫描图像,生成像素差分矩阵以及基元过渡矩阵。最后利用统计算法将上述两个矩阵合并为一个像素差分基元矩阵,实现了颜色、纹理以及空间信息等多特征的图像检索。在Corel标准图像数据库中执行图像检索方法间的对比实验,在Corel-4000图像数据库中执行旋转图像检索实验,实验结果表明,该方法不仅具有良好的检索表现,而且可以实现旋转图像的检索。
- 朱华东宋威
- 关键词:基元图像检索
- 基于GA优化QPSO算法的文本聚类被引量:8
- 2014年
- 针对量子行为粒子群优化算法中粒子搜索的盲目性以及初始聚类中心的选取对聚类结果的影响问题,提出了一种基于GA优化的QPSO聚类算法。该算法首先利用GA稳健的全局优化性能进行快速的粗略聚类,然后用GA的聚类结果初始化QPSO算法,以降低粒子群搜索的盲目性,从而提高QPSO算法的搜索效率。通过在Reuter-21578真实的文本数据集上实验,该算法在Fmeasure评价标准上获得了较高的查准率和查全率,从而验证了该聚类算法的有效性和可行性,可以在文本聚类领域推广应用。
- 乔莹莹宋威马伟
- 关键词:文本聚类粒子群优化算法量子行为粒子群优化算法遗传算法
- 基于密度的自适应搜索增量聚类法被引量:1
- 2016年
- 针对传统聚类算法对动态数据集的处理能力较低,且加入新增数据后导致原始聚类结果不再可靠,以及造成算法效率低下和计算资源浪费等不足。本文在基于DBSCAN聚类算法的基础上,通过改进数据对象的邻域半径和搜索数据对象的方式进行增量聚类,提出了一种基于DBSCAN的自适应搜索增量聚类算法。本文首先对提出的算法进行理论分析,其次将其与三种增量聚类算法进行对比实验,实验结果表明:该算法实现了对动态数据集的有效分析,提高了增量聚类结果的准确率和动态数据的处理能力。
- 周菊香钱雪忠孙志鹏宋威
- 关键词:增量聚类DBSCAN自适应搜索
- 基于语义特征选取与改进K均值算法的文本聚类研究
- 针对传统的K-MEANS算法存在容易陷入局部最优以及对初始聚类中心的高度依赖性等缺陷,提出了一种改进初始中心选取的新的K-MEANS算法.由于词空间的文本聚类方法很难处理文本的高维特性和复杂语义性,因此通过采用语义特征选...
- 何晓亮宋威梁久祯
- 基于TF-IQF模型和图聚类的个性化搜索研究
- 2011年
- 针对信息检索领域存在的用词歧义和检索词简短的问题,本文提出了一种基于TF-IQF模型和图聚类的个性化查询建议方法。对于用户的查询请求,提供查询建议,帮助用户进行查询修正,进而检索到其所需的信息;同时通过获取不同用户的查询偏好,以达到个性化查询推荐的目的。实验结果表明,该方法能够给出个性化的查询建议,为用户提供潜在感兴趣的资源,具有较高的准确率。
- 曹晓龙宋威梁久祯
- 关键词:个性化搜索
- 无锡美食智能搜索引擎的设计与实现
- 2013年
- 无锡地区拥有丰富的美食资源,目前国内外的通用搜索引擎所提供的信息量过大,查询不准确,智能化程度低。该研究为无锡广大美食爱好者提供了一个智能的查询平台。无锡美食智能搜索引擎的查询结果更精确、智能,是检索更加方便快捷的垂直搜索引擎。本文从无锡美食搜索引擎的设计流程入手,主要介绍了垂直搜索引擎各模块的功能、原理,包括爬虫的快速抓取、精确解析、高效存储等。
- 顾璠夏梦思宋威
- 关键词:垂直搜索引擎爬虫LUCENE
- 标签约束的半监督栈式自编码器分类算法被引量:4
- 2019年
- 栈式自编码器通过逐层无监督学习能够表达数据的语义特征,但面对具体领域问题时其特征训练缺乏针对性,所处理的数据用于分类领域时易导致分类准确度低,稳定性差等问题.针对这些问题,提出了一种标签约束的半监督栈式自编码器(LSSAE),结合无监督学习与监督学习的优势,在有效抽取样本内在特征的同时保证特征训练目标化.引入的标签约束项,以监督学习的方式逐层比对实际标签与期望标签,针对性地调整网络参数,进一步提高分类准确率.为验证所提方法的有效性,实验中对多个数据集进行广泛测试,其结果表明,相对自编码器(AE),稀疏自编码器(SAE),以及深度信念网络(DBN)等,LSSAE明显提高分类准确率和稳定性.
- 李炜宋威王晨妮张雨轩
- 关键词:半监督学习