张旭
- 作品数:2 被引量:10H指数:2
- 供职机构:辽宁工程技术大学软件学院更多>>
- 发文基金:国家自然科学基金辽宁省教育厅资助项目辽宁省教育厅科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于AT模型的微博用户兴趣挖掘研究被引量:5
- 2015年
- 随着微博的日趋流行与广泛使用,新浪等微博网站已经成为海量信息的来源,虽然传统的文本主题挖掘方法已经得到广泛的应用研究,但对于微博这种特殊结构的文本,传统的挖掘算法不能很好地对其进行研究。为了弥补目前微博平台主题挖掘方法的不足,以及考虑到微博信息的稀疏性,多维性等特点,提出有针对性的预处理方法,将用户微博数据与AT模型结合,通过吉布斯采样进行微博主题挖掘,对作者主题进一步提取得到用户兴趣。通过在真实数据集上的实验,以及与LDA模型对比,证明该模型能有效得到微博主题。
- 王永贵张旭刘宪国
- 关键词:主题挖掘
- 结合微博关注特性的UF_AT模型用户兴趣挖掘研究被引量:5
- 2015年
- 微博作为国内主流社交网站,信息量与日俱增。目前微博用户兴趣挖掘方法大多停留在研究用户浏览网页时点击行为、用户所发微博内容或所在社区等表象层面,尚未深入到微博用户使用特性层面。从用户微博内容出发,结合用户关注对象微博,提出一种改进作者主题模型UF_AT(users focus-author topic)。最后对真实数据进行实验得出,模型在用户兴趣主题以及主题词概率值上均高于AT模型,而且用户兴趣主题准确、全面,同时验证了UF_AT模型在挖掘用户兴趣中的有效性。
- 王永贵张旭任俊阳刘宪国