国家自然科学基金(61003051)
- 作品数:2 被引量:35H指数:2
- 相关作者:彭朝晖王新军成勇张传岩洪晓光更多>>
- 相关机构:山东大学人力资源和社会保障部更多>>
- 发文基金:山东省科技攻关计划国家自然科学基金国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于SVM和扩展条件随机场的Web实体活动抽取被引量:14
- 2012年
- 在传统信息抽取的基础上,研究Web实体活动抽取,基于格语法对实体活动进行了形式化定义,并提出一种基于SVM(supported vector machine)和扩展条件随机场的Web实体活动抽取方法,能够从Web上准确地抽取实体的活动信息.首先,为了避免人工标注训练数据的繁重工作,提出一种基于启发式规则的训练数据生成算法,将语义角色标注的训练数据集转化为适合Web实体活动抽取的训练数据集,分别训练支持向量机分类器和扩展条件随机场.在抽取过程中,通过分类器获得包含实体活动的语句,然后利用扩展条件随机场对传统条件随机场中不能利用的标签频率特征和关系特征建模,标注自然语句中的待抽取信息,提高标注的准确率.通过多领域的实验,其结果表明,所提出的抽取方法能够较好地适用于Web实体活动抽取.
- 张传岩洪晓光彭朝晖李庆忠
- 关键词:信息抽取格语法支持向量机
- 基于协同过滤与划分聚类的改进推荐算法被引量:21
- 2011年
- 针对个性化服务技术提出一种改进推荐算法,该方法基于协同过滤技术和划分聚类技术.首先建立了协同过滤推荐算法的计算矩阵,使算法能够参照矩阵来推荐信息,其次完善了矩阵的赋值范围,使推荐算法能综合所有用户的评价,最后添加了评价数值和更新系数,把算法的动态更新变为可能,从而推荐给用户最满意的信息.在此基础上还提出基于划分聚类的改进推荐算法,进一步提高了算法的准确性和实时性,并且用实验证明了基于划分聚类的最终推荐算法是最优的个性化服务推荐算法,能够提供给用户最满意的推荐信息.
- 吴泓辰王新军成勇彭朝晖
- 关键词:协同过滤划分聚类