庞海龙
- 作品数:4 被引量:41H指数:3
- 供职机构:长春工业大学计算机科学与工程学院更多>>
- 发文基金:吉林省教育厅“十二五”科学技术研究项目国家自然科学基金吉林省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 融合协同过滤和XGBoost的推荐算法被引量:11
- 2020年
- 协同过滤在数据处理中存在数据稀疏问题,影响推荐算法的准确性。提出融合协同过滤和XGBoost的推荐算法,根据用户对项目的评价以及项目本身所具备的自身特点,挖掘项目和用户的潜在关系,提高算法的推荐准确性。采用百度深度学习框架Paddle Paddle在Book-Crossings数据集上进行实验,实验结果表明,提出的算法和文献中两种算法相比,准确性有显著提升。
- 崔岩祁伟庞海龙赵辉
- 关键词:协同过滤推荐系统
- 融合协同过滤的线性回归推荐算法被引量:12
- 2019年
- 针对传统协同过滤算法中存在数据稀疏性问题,提出融合协同过滤的线性回归推荐算法。根据用户对项目的评分以及用户和项目的自身特征,构建用户间和项目间相似矩阵。基于相似矩阵,选出用户和项目最近邻集合,分别通过基于用户和基于项目的协同过滤算法来预测用户已评分项目的评分,将预测评分与真实评分的差值作为特征,组合在一起生成新的训练数据。把新的训练数据作为线性回归模型的输入,根据训练好的模型预测未知评分,采用top-N算法产生推荐列表。在MovieLens数据集上进行实验,实验结果表明新算法的推荐准确性较传统协同过滤算法有显著提高。
- 庞海龙赵辉李万龙马莹崔岩
- 关键词:协同过滤
- 一种分布式LDA主题模型方法
- 2017年
- 基于Spark分布式计算框架,采用Gibbs抽样方法研究分布式LDA主题模型挖掘方法。在Spark平台进行大规模数据集处理实验。
- 蒋权董亚则刘凯庞海龙
- 关键词:SPARK分布式计算主题建模
- 结合改进的CHI统计方法的TF-IDF算法优化被引量:18
- 2019年
- 为了克服传统的CHI统计方法存在特征项出现频率与类别负相关的情况和某一个特征项存在于某一个文本中的概率问题,针对传统的CHI统计方法引入了负相关判定、频度等重要因素进行了改进,并结合语义相似度的计算方法对TF-IDF算法进行了优化,在WEKA软件上采用了KNN(K-nearest neighbor)分类器和支持向量机(SVM)分类器分别对微博情感语料进行分类,该实验结果表明,新方法在文本分类的准确性上有明显的提高。
- 马莹赵辉李万龙庞海龙崔岩
- 关键词:文本分类