朱山风
- 作品数:4 被引量:5H指数:1
- 供职机构:复旦大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 一种基于多示例学习的MHC-I类分子新生抗原识别方法
- 本发明属于生物信息计算技术领域,具体为一种基于多示例学习的MHC‑I类分子新生抗原识别方法。本发明包括设计交互卷积网络结构,提取输入肽与每个MHC‑I分子的高维特征,以注意力机制为各个高维表征学习并分配权重,通过多示例学...
- 朱山风曲威
- 基于投票模型的元搜索排序合成算法被引量:4
- 2007年
- 排序合成问题是元搜索引擎研究的一个重要方面。该文分析了基于投票模型的排序合成问题。在讨论2个常用的投票规则Borda和Condorcet的基础上,介绍了用图论算法实现的淘汰投票算法,包括Kemeny算法。针对Kemeny算法是NP-hard问题,提出了一种易于实现的启发式淘汰投票算法,并且利用TREC数据集进行实验比较这些方法。实验结果表明,淘汰投票算法与Borda算法执行效果相当,有时甚至超过Borda算法。
- 姚昱朱山风陈莘萌
- 关键词:元搜索信息检索
- 基于实时反馈的大众点评网团购业务个性化搜索解决方案
- 2015年
- 大众点评网是国内领先的餐饮、购物、休闲娱乐及生活服务等领域的商户信息、消费优惠和消费评价的综合互动平台。针对用户个性化搜索的需求,并考虑到用户行为的时效性,大众点评网建立了一套基于Storm框架的个性化实时数据分析平台。该平台目前为团购搜索提供个性化搜索服务。线上大规模实践证明,基于Storm框架的实时数据分析平台对已有系统和HDFS集群具有良好的兼容性,并且具有高效、实时、稳定等优点。该平台完全能够胜任TB级别数据的实时处理和日均上亿次的服务调用。此外,大量实验显示,对用户实时反馈的个性化分析能够显著提升团购附近搜索的性能。预计切换全流量后,月度将新增100K购买用户及10M交易额。
- 陈一村马尧王新春朱山风
- 关键词:个性化搜索用户行为分析
- 基于距离学习的生物医学文本聚类算法研究被引量:1
- 2010年
- 近年来,随着生物医学文献数量的大量增加,对生物医学文献进行搜索和挖掘,查找有用的信息成为了生物信息学的一个重要研究方向。聚类作为一种无监督的自动化程度很高的机器学习方法,在信息检索和生物信息学领域中获得了广泛的运用。针对生物医学文本的特点提出了基于距离学习的聚类算法,实验结果证明了该方法的有效性。
- 袁伟朱山风
- 关键词:向量空间模型文本聚类