黄威靖
- 作品数:7 被引量:13H指数:3
- 供职机构:北京大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- ACT-LDA:集成话题、社区和影响力分析的概率模型被引量:4
- 2013年
- 随着社交网络的发展,社交网络中的用户形成大规模的用户关系图,用户在社交网络中发表内容,这些内容及其链接关系形成大规模的文档图。如何根据用户关系图、文档图,挖掘出用户所形成的社区、社区用户的影响力以及各个社区的话题,是重要的问题,而目前这些工作相对独立。考虑了用户发表内容、用户之间的关系信息,利用话题传播、社区形成和用户影响力之间的关联性,提出了一个基于LDA(latent Dirichlet allocation)的集成话题发现、社区发现和用户影响力分析的统一模型ACT-LDA(author-community-topicLDA)。模型采用变分推理的方法解决推理问题。在DBLP数据上进行了实验,取得了非常好的结果,证明了模型的有效性。
- 吴良黄威靖陈薇王腾蛟雷凯刘月琴
- 关键词:社交网络
- ELPS:一种高效的微博信息传播轨迹提取算法被引量:4
- 2014年
- 近年来,随着社会性网络服务应用(SNS)的流行与发展,SNS已成为人与人之间重要的交流渠道。SNS中大量用户产生的数据内容包含了社会网络中信息传播的客观知识,由此SNS可用于研究社会网络中公众舆论的变化趋势及信息传播的相关规律。由于SNS服务中节点规模大、其用户间的信息传播通常出现离散而稀疏的情况,需要高效的信息传播观察手段。为解决该问题,提出信息传播轨迹用于研究社会网络中信息传播的基本规律,具体的方法为:(1)提出信息传播轨迹(info-trajectory)模型以记录社会网络中信息传播的具体路径;(2)针对微博社会网络,提出几个高效的信息传播轨迹抽取算法;(3)根据已获取的信息传播轨迹研究用户间转发信息行为的时序规律;(4)提出算法K-advocators-discover用于发现社会网络中促进信息传播的top-k名用户;(5)提供充分的实验测试来将所提方法用于抽取新浪微博上热点话题信息的传播轨迹,并采用K-advocators-discover算法分析新浪微博中促进信息传播的用户。实验结果验证,所提方法能高效地提取微博中信息传播轨迹,挖掘其中促进信息传播的用户。
- 王悦黄威靖
- 关键词:社会网络
- Web社会网络核心用户信息交互演化分析方法
- 本发明公开了一种Web社会网络核心用户信息交互演化分析方法包括:1)从Web社会网络应用程序获取用户互动信息数据;2)确定核心用户节点;3)根据获取的数据通过增量计算方法建立Web社会应用网络图结构;4)计算所有图结构中...
- 王悦黄威靖陈薇王腾蛟杨冬青
- 基于交互式文档聚类的信息检索方法及系统
- 本发明提供一种基于交互式文档聚类的信息检索方法和系统,其步骤包括:对文档集进行水平划分和预处理;进行词频统计,并将高频词组成特证词集合;生成文档的向量空间表示,计算文档间的距离并生成相似度矩阵;生成拉普拉斯矩阵,根据拉普...
- 黄威靖于倩陈薇王腾蛟杨冬青
- 文献传递
- EMTM:微博中与主题相关的专家挖掘方法被引量:5
- 2015年
- 目前,微博已成为人们获取信息、分享信息的最流行平台之一.经过长期的发展积累,微博中聚集了很多具有权威专业知识背景的专家,挖掘微博中与主题相关的专家有利于进一步地用户推荐、微博舆情分析等工作.在微博中,与某个主题相关的专家是指因具有可靠的与此主题相关的专业知识或技能而在此主题下具有高影响力的用户.挖掘高影响力的用户可以通过分析微博的转发数据来进行,然而由于微博中用户的转发行为分为"主题相关转发"和"跟随转发"2种,因此,因被转发概率高而具有高影响力的用户不一定是专家.EMTM(experts mining topic model)是一种基于主题模型的概率生成模型,通过区分微博用户的不同转发行为来挖掘微博中与主题相关的专家.模型采用Gibbs采样进行推理求解.在真实的新浪微博数据集上的对比实验表明EMTM能够有效地挖掘微博中与主题相关的专家.
- 张腊梅黄威靖陈薇王腾蛟雷凯
- 关键词:主题
- Web社会网络核心用户信息交互演化分析方法
- 本发明公开了一种Web社会网络核心用户信息交互演化分析方法,包括:1)从Web社会网络应用程序获取用户互动信息数据;2)确定核心用户节点;3)根据获取的数据通过增量计算方法建立Web社会应用网络图结构;4)计算所有图结构...
- 王悦黄威靖陈薇王腾蛟杨冬青
- 文献传递
- 基于交互式文档聚类的信息检索方法及系统
- 本发明提供一种基于交互式文档聚类的信息检索方法和系统,其步骤包括:对文档集进行水平划分和预处理;进行词频统计,并将高频词组成特证词集合;生成文档的向量空间表示,计算文档间的距离并生成相似度矩阵;生成拉普拉斯矩阵,根据拉普...
- 黄威靖于倩陈薇王腾蛟杨冬青
- 文献传递