经典的Top-N推荐算法利用用户正反馈信息对全部项目进行排序,然后选择前N个项目推荐给用户.针对经典推荐算法未充分利用用户负反馈信息的问题,提出基于正负反馈的SVM协同过滤(SVM Collaborative Filtering based on Positive and Negative Feedback,PNF-SVMCF)Top-N推荐算法,充分利用用户负反馈信息过滤测试集中用户可能不喜欢的项目,只对测试集中剩余的项目进行Top-N排序.PNF-SVMCF算法过滤用户可能不喜欢的项目,这样可以缩减需要排序的项目规模,提升推荐效率;同时去除这些项目对排序的干扰,提高推荐精度.在MovieLens数据集上的实验结果表明,该方法具有良好的推荐速度和精度,特别是在较少的推荐项目情况下,能够表现出更好的推荐精度.
粒度支持向量机(Granular Support Vector Machine,GSVM)通过选取粒的代表点构成精简训练集以提高支持向量机(Support Vector Machine,SVM)的学习效率,然而选取个别代表点有可能丢失部分重要分类信息,导致模型泛化能力不高.针对这一问题,提出基于粒分布的GSVM(Distribution Based GSVM,DGSVM)加速训练方法,该方法依照粒内正负样本分布选取粒代表点,根据粒的混合度将这些代表点分为精简训练样本集和修正集,使用精简训练样本集训练得到分类器,用修正集迭代优化分类器.本质上DGSVM是用少量难分的样本训练快速得到初始分类器,然后再进行进一步调整.在标准数据集上的实验结果表明DGSVM方法可以在保证算法学习效率的同时提高分类器的泛化能力.