国家自然科学基金(60275026) 作品数:44 被引量:252 H指数:8 相关作者: 苑森淼 董立岩 刘光远 王双成 李永丽 更多>> 相关机构: 吉林大学 东北师范大学 上海立信会计学院 更多>> 发文基金: 国家自然科学基金 吉林省自然科学基金 上海市教育委员会重点学科基金 更多>> 相关领域: 自动化与计算机技术 金属学及工艺 理学 电子电信 更多>>
混合贝叶斯网络隐藏变量学习研究 被引量:13 2005年 目前,具有已知结构的隐藏变量学习主要针对具有离散变量的贝叶斯网和具有连续变量的高斯网.该文给出了具有连续和离散变量的混合贝叶斯网络隐藏变量学习方法.该方法不需要离散化连续变量,依据专业知识或贝叶斯网络道德图中Cliques的维数发现隐藏变量的位置,基于依赖结构(星形结构或先验结构)和Gibbs抽样确定隐藏变量的值,结合扩展的MDL标准和统计方法发现隐藏变量的最优维数.实验结果表明,这种方法能够有效地进行具有已知结构的混合贝叶斯网络隐藏变量学习. 王双成关键词:混合贝叶斯网络 GIBBS抽样 基于依赖分析的马尔科夫网络分类器学习与优化 被引量:1 2006年 对可分解概率模式在0-1损失下证明马尔科夫网络分类器是最优分类器。针对目前建立马尔科夫网络分类器结构效率和可靠性低的问题,基于变量之间基本依赖关系、基本结构和依赖分析思想进行马尔科夫网络分类器结构学习来避免这些问题。并通过去除不相关和冗余属性变量的方法实现对马尔科夫网络分类器的优化,以提高抗噪声能力和预测能力。分别使用模拟和真实数据进行分类器分类准确性比较实验,实验结果显示优化后的马尔科夫网络分类器具有良好的分类准确性。 王双成 刘喜华 唐海燕关键词:分类器 弦图 数据挖掘技术在话务网数据分析中的研究与应用 被引量:2 2006年 利用数据挖掘技术设计了移动通信话务网管数据挖掘系统,将概念、分类、关联、时间序列分析等算法应用于话务网管数据分析中,重点介绍分类分析算法在话务网管数据分析系统中的应用. 徐沛娟 惠玥 李艾瑛 孙国荣关键词:数据挖掘 数据分析 基于贝叶斯网络的马尔科夫毯预测学习 被引量:7 2004年 研究变量之间的预测能力在许多领域都有重要意义,通过这种研究,能够揭示变量之间的制约机制,贝叶斯网络是研究变量之间预测能力的有力工具。本文使用依赖分析方法建立基于贝叶斯网络的马尔科夫毯预测,其核心问题是贝叶斯网络结构学习。目前,基于依赖分析的贝叶斯网络结构学习方法主要存在三个问题:(1)需要进行大量的高维条件概率计算,(2)容易丢失弱联合依赖边,(3)对边的方向的确定具有局限性。针对这些问题,本文提出了首先进行递推条件独立性检验,然后进行因果语义定向,最后进行冗余边检验的贝叶斯网络结构学习方法。该方法能够有效地避免这些问题,更准确地建立马尔科夫毯预测。 王双成 苑森淼 王辉关键词:贝叶斯网络 数据挖掘技术在交通事故分析中的应用 被引量:21 2006年 结合关联规则与粗糙集的思想,提出了基于偏好信息的决策规则约简算法,并将该算法应用于长春市历年的道路交通事故数据分析中,从而找出交通事故发生的潜在规律. 董立岩 刘光远 苑森淼 李永丽 吴志辉关键词:数据挖掘 粗糙集 关联规则 基于移动agent的分布式入侵检测系统研究 被引量:2 2009年 为了提高现有分布式入侵检测系统的效率和性能,提出了一种基于移动agent的分布式入侵检测系统模型。将移动agent技术应用于入侵检测中,并给出了其移动agent间的可靠通信方法,实现了agent的协同检测。实验结果表明,由于移动agent的应用,入侵检测系统的节点成为了可移动的部件,从而使该模型具有了更强的抗攻击性和入侵检测能力。 徐沛娟 曹锦纲 郑顾平 张龙飞 张林关键词:移动AGENT 分布式入侵检测 网络安全 中文文本分类相关算法的研究与实现 被引量:14 2009年 通过对分词歧义处理情况的分析,提出一种基于上下文的双向扫描分词算法,对分词词典进行改进,将词组短语的固定搭配引入词典中.讨论了特征项的选择及权重的设定,并引进2χ统计量参与项的权值计算,解决了目前通用TF-IDF加权法的不足,同时提出了项打分分类算法,提高了特征项对于文本分类的有效性.实验结果表明,改进后的权重计算方法性能更优越. 徐沛娟 李雄飞 惠玥 张桂林关键词:文本分类 向量空间模型 基于贝叶斯分类器的重大危险源辨识 被引量:4 2009年 针对应急领域重大危险源的识别问题,提出一种新的识别模型:基于贝叶斯分类器的重大危险源识别模型.先利用已知知识建立模型,再根据建立的模型运用概率判断新的识别对象是否为重大危险源.分别将识别模型应用于化工产品生成领域和森林防火领域,实验结果与实际情况相符,表明该模型效果较好. 董立岩 李真 阎鹏飞关键词:贝叶斯分类器 数据挖掘 重大危险源辨识 应急预案 基于类约束的贝叶斯网络分类器学习 被引量:34 2004年 分类能力是人类经过学习得到的重要而基本的能力 ,也是机器学习、模式识别和数据采掘研究的核心问题 .在0 - 1损失率下 ,证明了基于类约束的贝叶斯网络分类器是最优分类器 .建立该分类器的核心问题是基于类约束属性贝叶斯网络结构学习 ,给出了学习属性贝叶斯网络结构的方法 ,在学习过程中使用了根据弧方向因果语义确定边方向的方法 ,并和碰撞识别定向相结合 ,在边定向之后进行冗余弧检验 ,解决了目前冗余边检验在定向之前所导致的问题 ,显著提高了结构学习效率和准确性 .并使用模拟数据进行了分类实验和分析 . 王双成 苑森淼 王辉关键词:贝叶斯网络分类器 数据挖掘方法在用户流失预测分析中的应用 被引量:5 2007年 移动通信在高速发展的同时,出现了大量用户离网的现象,基于客户信息、消费行为等历史数据,进行客户离网预测分析成为各个运营商普遍关注的问题。文章基于客户的历史数据和短期偶发数据,提出了链型数据挖掘方法,并结合决策树,形成了一个综合的链型树分类器(Chain Tree Classifier,CTC)和用户行为预测模型,实验结果显示,该分类器对移动通信运营商感兴趣的单个事件发生具有良好的预测能力,可被应用到客户离网预测中,从而帮助运营商提前发现具有离网倾向的用户,进而获得更高的利润。 刘光远 苑森淼 董立岩关键词:数据挖掘