韩伟
- 作品数:55 被引量:194H指数:8
- 供职机构:华东师范大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划江苏省“青蓝工程”基金更多>>
- 相关领域:自动化与计算机技术经济管理文化科学电子电信更多>>
- 基于模糊强化学习的电子市场动态定价
- 本文以电子市场智能定价问题为研究背景,提出了基于模糊推理的多智能体强化学习算法(FI-MARL)。在马尔科夫博弈学习框架下,将领域知识初始化为一个模糊规则集合,智能体基于模糊规则选择动作,并采用强化学习来强化模糊规则。该...
- 韩伟
- 关键词:电子市场模糊推理
- 基于情节序列训练的电子市场智能定价算法被引量:3
- 2007年
- 以B2B电子市场中卖方agent的智能定价问题为应用背景,在库诺特短视调整基础上,应用Q学习算法,提出了基于情节序列训练的学习方法,将纯粹以结果为反馈的强化学习方法和以推理为目标的慎思过程结合起来,提高了算法的在线学习性能。仿真实验验证了算法的有效性,为推向实际应用奠定了基础。
- 韩伟
- 关键词:智能AGENT电子市场
- 电子市场排污权交易的多智能体协商方法
- 2011年
- 为了平衡经济发展和污染治理之间的矛盾,将地理位置相对集中的排污企业建立专业电子市场用于排污权的交易。在控制排污总量的前提下,通过合理安排生产来最大化排污企业的收益。基于市场交互机制,给出了一个多智能体协商框架。每个智能体代表一家企业参与协商,在不暴露企业商业信息前提下,在当前污染物价格下通过规划方法计算污染物需求量。市场端接收每种污染物需求量并计算每种污染物价格,然后作为公共信息加以发布。仿真实验表明,相对于按比例单独缩减排污量,协商结果使得污染企业的个体收益都有所提高,从而增大了社会收益。
- 韩伟宋柱芹
- 关键词:多智能体系统电子市场
- 带贯通约束的不规则排样分阶构造算法被引量:2
- 2012年
- 针对玻璃排样问题,首次研究带贯通性约束的不规则凸多边形的Bin Packing问题.提出一种针对图形组合进行优化的分阶构造算法.该算法能够隐式实现贯通约束,并利用各阶种群之间清晰的组合关系,将多个多边形的形态优化问题转化为一个结构化的多步决策问题,提高了原片利用率.为了控制新组合图形的形状,构造过程引入变动的形状权重,并给出散列函数来控制形状权重的变化.分别用中英双方玻璃厂订单数据进行测试,显示本文算法比二步法等方法平均利用率有较大提高.
- 韩伟马福民
- 关键词:动态规划
- 基于黑板模型的多智能体合作学习被引量:11
- 2007年
- Q学习算法要求智能体无限遍历每个状态-动作转换,因此在涉及状态-动作空间非常大的应用问题时,导致收敛速度非常慢。借助多智能体的合作学习,智能体之间基于黑板模型的方法通过开关函数相互协调合作,可以更快地定位那些有效的状态-动作转换,避免了无效的更新,从而以较小的学习代价加快了Q表的收敛速度。
- 韩伟韩忠愿
- 关键词:多智能体系统黑板模型
- 基于模糊约束规划的自动协商被引量:2
- 2008年
- 给出了一个基于模糊约束规划模型的自动协商系统。建立了模糊约束规划模型并利用模糊模拟、神经网络和遗传算法给出了求解Pareto最优解的混合智能算法;协商过程中卖方智能体根据神经网络拟合的效用函数并运行混合智能体算法得到当前协商步的Pareto最优解,避免了对大型商品数据库的反复搜索,为系统推向实际应用奠定了基础;协商模型仿真实验表明了协商系统返回的解与实际调查得到的用户偏好相一致。
- 韩伟
- 关键词:自动协商智能体
- 电子市场环境下的多智能体学习与协商
- 随着互联网络的迅速发展,人们倾向于将越来越多的互联系统看作是多个相互交互的自主智能体,这种面向智能体的方法学为我们分析、设计、实施和评价复杂的分布式系统提供了强有力的工具。多智能体系统(MAS)和智能体技术正是在这个背景...
- 韩伟
- 关键词:多智能体系统博弈论电子市场遗传算法自动协商
- 基于智能Agent的供应商选择策略被引量:2
- 2004年
- 面向实际应用研究了电子市场中买方Agent的供应商选择问题,基于Gittins的方法,给出了全面考虑价格、质量和购买概率等因素的情况下计算每个供应商吸引指数的方法。对于新的供应商,可以用平均参数计算吸引指数。
- 韩伟王云王成道
- 关键词:供应商选择电子市场买方
- 基于模拟退火的自适应离散型布谷鸟算法求解旅行商问题被引量:28
- 2018年
- 提出了一种基于模拟退火的自适应离散型布谷鸟算法求解旅行商问题.该算法在布谷鸟搜索算法原理的基础上,构造了旅行商问题的路径求解策略.由于算法的局限性,随着算法的调整和迭代次数的增加,容易破坏已形成的路径,从而使得算法通用性不强.针对这一局限性,本文提出了一种自适应局部调整算子和全局随机扰动策略.采用简单的2-opt算子作为局部优化算子加快算法收敛速度,引入模拟退火机制防止算法陷入局部最优.采用标准TSPLIB多组数据进行测试,并与有代表性的优化算法进行结果比较.实验结果证明了该算法在精度和稳定性方面的优势.
- 张子成韩伟毛波
- 关键词:旅行商问题
- 基于公共知识的电子市场定价算法被引量:2
- 2005年
- 研究了电子市场定价博弈中公共知识的作用,通过简单地改变市场需求函数和市场分配函数,使卖方Agent获得了多Agent作用下的不断改变着的环境知识,而不再是关于市场需求的个体知识。仿真实验表明,通过获得关于市场需求的公共知识,卖方Agent可以协调彼此的价格行为,在合作还是竞争问题上表现出更长远的群体智能行为,从而提高了市场配置资源的有效性。
- 韩伟王云王成道白治江
- 关键词:智能AGENT电子市场博弈论