刘奕群
- 作品数:148 被引量:688H指数:13
- 供职机构:清华大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学政治法律医药卫生更多>>
- 睡眠质量预测方法及装置
- 本公开涉及一种睡眠质量预测方法及装置,所述方法包括:获取目标用户在睡眠时刻之前的预设时间段内的用户信息,所述用户信息包括用户生理信息、用户活动信息、用户所在环境信息、用户饮食信息以及用户睡眠信息中的至少一种;根据所述目标...
- 张敏李佳玉马为之刘奕群马少平
- 文献传递
- 面向信息检索需要的网络数据清理研究
- Web数据中的质量参差不齐、可信度不高以及冗余现象造成了网络信息检索工具存储和运算资源的极大浪费,并直接影响着检索性能的提高。现有的网络数据清理方式并非专门针对网络信息检索的需要,因而存在着较大不足。本文根据对检索用户的...
- 刘奕群张敏马少平
- 关键词:网络信息检索数据清理
- 文献传递
- 基于查询子主题分类的多样性搜索评价方法被引量:1
- 2015年
- 多样化检索结果的评测通常假设一个查询词包含多个权重各不相同的用户子意图,并在此假设的基础上对检索结果进行评测.虽然大多数已经存在的多样化检索评测方法利用了这些特性对检索结果进行评测,但在评测过程中,它们都忽略了查询子意图的类型信息;而不同类型的查询子意图对信息需求具有不同的特点.首先,通过引入衰减函数对这种特点进行描述,进而对用户子意图的分类方法进行抽象;在此基础上,提出了利用查询子意图类型信息进行多样化检索结果评测的框架,该框架定义了利用查询子意图类型信息进行多样化检索评测的方法应该具有的结构;然后,讨论了在用信息类和导航类作为子意图分类方法的前提下,其对应的衰减函数的形式;最后,在TREC与NTCIR测试集上的实验结果表明了所提出方法的有效性.
- 陈飞刘奕群张敏马少平
- 基于用户行为分析的网页目录自动构建
- 在过去的十多年里,互联网上的网站数量呈指数增长趋势,互联网上的网站数量已经突破1.5亿,而网页数量更是达到数百亿。用户往往需要借助搜索引擎和网页目录才能从这样海量的网页当中找到符合自己需求的高质量网页。传统的网页目录几乎...
- 黄志毅刘奕群马少平
- 关键词:聚类
- 文献传递
- 基于群体智慧的Web访问日志会话主题识别研究被引量:5
- 2011年
- Web访问日志中的会话(session)是指特定用户在一定时间范围内的访问行为的连续序列。会话主题(topic)是指会话中具有相同用户意图的部分。从会话中进一步识别出能体现用户意图的处理单元(topic)是进行用户访问行为分析的重要基础。目前相关工作主要集中在边界识别上,无法处理用户意图交叉情况。为了解决该问题,该文重新形式化定义了session和topic的相关概念,提出最大划分的求解任务,并设计出了基于用户群体智慧的会话主题识别算法。在使用大规模真实Web访问日志的实验中,我们的算法取得了不错的效果。
- 方奇刘奕群张敏茹立云马少平
- 关键词:WEB访问日志
- 一种搜索引擎性能评价的自动化处理方法
- 本发明属于互联网信息处理领域,其特征在于:它首先从搜索引擎用户访问日志中提取出用户的查询信息,在此基础上对用户查询进行分类;随后,对于不同类型的用户查询,根据用户访问日志中的用户点击信息进行自动分析,得出对应这些查询的用...
- 刘奕群张敏金奕江马少平
- 文献传递
- 信息交互过程中相关性判断的变化模式:一项课程论文写作任务下的田野实验研究被引量:1
- 2022年
- [目的/意义]为了更加智能、有效地帮助用户在完成任务的过程中获取有用的信息,更好地理解真实任务场景下信息交互过程中用户的相关性判断及其变化模式,具有十分重要的意义。[方法/过程]文章以基于任务的信息交互模型为基础,利用兼具可控性和生态效度的田野实验方法,针对真实的课程论文写作任务,调查了信息交互过程不同阶段用户相关性判断所发生的变化,包括判断文献的相关性、判断信心、判断标准及其类别重要性等。[结果/结论]研究发现,从信息搜索到加工处理阶段,文献的相关性以及用户的判断信心均会发生渐进但显著的变化,且导致文献相关性发生变化的原因也是多方面的。仅有少数判断标准及标准类别的重要性在这两个阶段有显著差异。本研究不仅有利于增进对真实任务下信息交互过程的理解,同时有助于对用户信息素养教育和信息系统设计与开发提供一定的洞察和启发。
- 王志红曹树金刘奕群
- 关键词:信息交互
- 中文搜索引擎用户行为的演化分析
- 搜索引擎已经成为人们生活和工作中不可或缺的信息获取工具,对于互联网信息的合理、充分利用发挥着至关重要的作用。用户行为分析一直是搜索引擎提升性能的重要途径,但当前的搜索用户行为分析技术多局限在较短时间段,缺乏对长期时间内用...
- 马少平刘奕群刘健张敏祝建华茹立云
- 关键词:网络信息搜索引擎技术用户行为分析
- 文献传递
- 基于用户行为分析的搜索引擎自动性能评价被引量:27
- 2008年
- 基于用户行为分析的思路,提出了一种自动进行搜索引擎性能评价的方法.此方法能够基于对用户的查询和点击行为的分析自动生成导航类查询测试集合,并对查询对应的标准答案实现自动标注.基于中文商业搜索引擎日志的实验结果表明,此方法能够与人工标注的评价取得基本一致的评价效果,同时大大减少了评价所需的人力资源,并加快了评价反馈周期.
- 刘奕群岑荣伟张敏茹立云马少平
- 关键词:网络信息检索性能评价用户行为分析
- 基于用户行为的微博用户社会影响力分析被引量:77
- 2014年
- 社会影响力分析是当前在线社会网络研究中的热点方向.随着微博成为了一种至关重要的大众媒体,更好的分析和衡量微博用户的社会影响力引起越来越广泛的关注.基于从新浪微博收集的大规模数据集,作者结合社会影响力在微博环境中的传播情况,分析了用户行为因素之间的关系.然后提出了一个通过预测用户传播信息能力大小来分析和度量用户社会影响力的方法.该方法结合了来自社会网络结构和用户行为因素两方面的信息,获得了更好的影响力估计结果.基于大规模数据的实验结果表明,作者提出的方法是较为有效的.
- 毛佳昕刘奕群张敏马少平
- 关键词:用户行为分析社会网络社会影响力信息传播社会计算