郑麟
- 作品数:4 被引量:21H指数:2
- 供职机构:武汉大学计算机学院更多>>
- 发文基金:国家自然科学基金湖北省自然科学基金更多>>
- 相关领域:自动化与计算机技术石油与天然气工程更多>>
- 基于属性提升与局部采样的推荐评分预测被引量:7
- 2016年
- 评分预测问题是推荐系统研究的一个分支.在上下文感知推荐(Context-Aware Recommendation,CAR)中,常常需要考虑上下文因子(或称属性)对评分预测效果的影响.现有模型大多是捕捉单个属性的特征并加上多个属性间的相互作用(简称属性交互)实现评分预测.然而,有些算法在捕捉属性间的相互作用时没有针对性,使一些属性交互对预测结果没有帮助,甚至降低模型性能;而且,在实现属性交互时,很多算法只是单纯地使用固定的属性值,没有从某个方面挖掘出它们的潜在特征.为了解决这些问题,文中提出了属性提升(Attribute Boosting,AB)框架,从用户、物品与属性类型3个方面分别与属性进行交互.这种更精细的建模方式使属性能够自动地适应用户偏好、物品关联与类型特征,并能在评分预测中充分地发挥作用.在此基础上,文中结合概率图模型的低秩近似能力和随机梯度下降(Stochastic Gradient Descent,SGD)的快速训练优势,在算法性能和训练效率上进行权衡,设计了局部采样(Partial Sampling,PS)方法学习属性提升框架的参数,最终构成完整的属性提升与局部采样(Attribute Boosting with Partial Sampling,ABPS)模型.实验证明,ABPS模型通过有针对性的属性交互,能有效地挖掘出属性有用的隐含特征,从而减少盲目交互带来的消极影响;利用局部采样,该模型能使用更低的特征维度描述个性化信息,取得比其他模型更好的效果.
- 郑麟朱福喜姚杏
- 关键词:推荐系统评分预测数据挖掘
- 上下文分解机的自适应更新策略
- 2016年
- 分解机模型已经被成功应用于上下文推荐系统。在分解机模型的学习算法中,交替最小二乘法是一种固定其他参数只求单一参数最优值的学习算法,其参数数目影响计算复杂度。然而当特征数目很大时,参数数目随着特征数目急剧增加,导致计算复杂度很高;即使有些参数已经达到了最优值,每次迭代仍更新所有的参数。因此,主要改进了交替最小二乘法的参数更新策略,为参数引入自适应误差指标,通过权重和参数绝对误差共同决定该参数更新与否,使得每次迭代时重点更新最近两次迭代取值变化较大的参数。这种仅更新自适应误差大于阈值的参数的策略不但减少了需要更新的参数数目,进而加快了算法收敛的速度和缩短了运行时间,而且参数权重由误差决定,又修正了误差。在Yahoo和Movielens数据集上的实验结果证明:改进的参数更新策略运行效率有明显提高。
- 姚杏朱福喜阳小兰郑麟刘世超
- 关键词:推荐系统
- 一种直接生成频繁项集的分治Apriori算法被引量:14
- 2014年
- 针对Apriori算法的不足,提出基于项数布尔矩阵的改进算法MPIN_Apriori。改进算法运用分治思想将数据集分段处理,使用事务项数进行矩阵压缩并利用向量交运算和先验剪枝直接生成局部频繁k-项集,最终合并为全局频繁k-项集。该算法从根本上改进了Apriori算法频繁迭代的流程,避免了连接运算而且极大减轻了内存负担。实验结果表明在进行大型数据库频繁项集挖掘时其效率明显高于Apriori算法,而且对分布式数据挖掘有参考价值。
- 郑麟
- 关键词:APRIORI算法频繁项集分治
- 上下文分解机的自适应更新策略
- 分解机模型已经被成功应用于上下文推荐系统中。在分解机模型的学习算法中,交替最小二乘法是一种固定其他参数只求单一参数最优值的学习算法,其参数数目影响计算复杂度。然而当特征数目很大时,参数数目随着特征数目幂次方增加,导致计算...
- 姚杏朱福喜郑麟刘世超阳小兰