王志文
- 作品数:3 被引量:1H指数:1
- 供职机构:广东石油化工学院计算机与电子信息学院更多>>
- 发文基金:广东省自然科学基金国家级大学生创新创业训练计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种改进PageRank的微博用户影响力计算方法
- 2016年
- 以新浪微博为研究对象,基于MapReduce编程框架技术和PageRank评定方法,综合微博网络拓扑特征和用户行为因素,甄选出"直联热度"和"级联热度"等量化指标,用以表征评定微博用户影响力的动静态因素。构建了评估体系,提出一种基于混合量化指标与改进PageRank的微博用户影响力度量算法,并采用真实微博数据对该算法进行测试,对微博用户影响力进行了排名评估,与PageRank算法相比,表现出了较好的性能。
- 郑远飞陈晓升王志文陈坚旋陈珂
- 情感计算和文本挖掘的商品评论倾向性分析
- 2016年
- 文章基于提取用户评论中用户的观点和评论的极性,利用基于句法分析的模式匹配方法来提取特征词,建立特征词集合。采用了TF-IDF算法来抽取匹配特征词的观点词集合,去除贡献度低的观点词,然后采用简约相似度算法来量化种子词和目标观点词之间的相似度,该相似度能够很好的代表未知目标词在一个句子中的倾向性,从而为量化用户观点极性打下基础。最后以某电商平台上的商品成交记录作为实验测试数据,得到不同商品在不同特征之间的评价差异,从而挖掘出用户的个性化需求。
- 许林峰蓝鼎栋张俊峰王志文陈珂
- 基于MVC设计模式的微博数据采集框架被引量:1
- 2017年
- 针对现有社交数据采集工具在采集量和采集广度上受限与复用性差等问题,提出了一种基于MVC设计模式的数据采集设计方案,设计了可扩展的工作流处理流程,降低了开发耦合度,减少了开发的工作量。在此基础上,利用Java等技术搭建了快速而简捷的微博数据采集框架,实现并增强了抓取微博数据等功能,为用户提供了一个灵活、可扩展、易复用的微博数据采集环境。
- 王志文陈珂陈晓升郑远飞陈坚旋
- 关键词:爬虫JAVA数据采集MVC