张梦 作品数:4 被引量:20 H指数:3 供职机构: 北京工商大学计算机与信息工程学院 更多>> 发文基金: 国家自然科学基金 教育部人文社会科学研究基金 北京市属高等学校科学技术与研究生教育创新工程建设项目 更多>> 相关领域: 自动化与计算机技术 理学 更多>>
基于内容的热点话题传播模型 被引量:9 2013年 采用传染病模型对网络热点话题的传播进行建模具有重要的价值,但是现有的传染病模型并没有区分话题类型和不同用户传播话题的概率,为此提出一个基于内容的网络热点话题传播模型.模型中引入了用户对话题传播的敏感度,基于用户话题敏感度定义了单个用户传播话题的概率,融合话题的内容分类特性、用户传播概率、用户重入概率等因素,借鉴SIRS模型的基本思想,构建了话题传播模型(CSIRS).在无标度网络、小世界网络、随机网络和真实社会网络上作了不同实验,实验结果表明CSIRS模型不仅能够呈现一般传染病动力模型的传播模式,还能够呈现多个波动、小范围长时间传播、快速上升缓慢下降等社会网络热点话题的传播模式.该模型为融合网络结构和话题内容属性建模话题传播过程带来新的研究思路. 韩忠明 张慧 张梦关键词:传染病模型 大规模短文本的快速话题发现方法与评价研究 被引量:3 2015年 传统的话题发现研究主要针对于长文本及新闻数据集,大规模短文本具有稀疏、无结构、多噪等特点,传统方法很难有效发现话题。提出了一个融合词共现与加权GN(CW-WGN)算法的快速话题发现方法,描述了CW-WGN方法的详细过程,给出方法的具体算法。采集了sina微博、新闻网站的标题真实的短文本数据,构建了基础测试数据集,采用LDA与K-means方法作为对比进行了大量对比实验。实验结果表明CW-WGN比LDA和K-means方法能够多发现20%以上的正确话题,而且发现的话题纯度也高于LDA与K-means。此外,CWWGN消耗的时间最少,能够有效地从实际大规模短文本上发现话题。 韩忠明 张慧 张梦 黄今慧关键词:词共现 社团发现 基于自激点过程的网络热点话题传播模型 被引量:7 2016年 建模互联网中热点话题的传播过程具有重要的意义和价值,该文以网络热点话题为研究对象,基于自激霍克斯过程提出一个话题传播模型(Self-Exciting Point Process Model,SEPPM).SEPPM利用用户参与话题的自激效应,将话题传播过程建模为一个随机点过程.同时,SEPPM也考虑了话题传播的外部因素,综合形成话题传播模型.为了验证该模型的有效性,该文从仿真和实证两个角度分别进行了大量的实验比较,提出话题仿真算法,仿真结果说明SEPPM可以生成多种符合热点话题传播特征的模式.实际数据上的结果说明SEPPM不仅能够很好地拟合真实话题的传播过程,还能够有效地预测话题传播趋势. 韩忠明 张梦 谭旭升 段大高 司慧琳关键词:社会媒体 社交网络 数据挖掘 有效的社会媒体热点话题传播模型研究 被引量:1 2015年 交互式社会媒体上的热点话题具有巨大的影响力,对热点话题进行建模和预测是一个非常重要但困难的问题.针对话题参与用户的特点进行了分析,构建了用户活跃度以及用户重入概率等模型的合理假设条件.根据话题发展模式和基于用户参与话题概率构建了单峰模型和多峰模型.分别基于两个不同数据集对模型进行了拟合和预测试验,试验结果表明,本文提出的模型在拟合与预测话题的发展趋势上的效果都优于SpikeM模型,尤其是对具有复杂波动发展模式的话题,提出的模型能很好地拟合与预测话题的波动. 韩忠明 张梦 李梦琪 莫倩 刘鹂关键词:时间序列 传染病模型