钱晓东
- 作品数:9 被引量:102H指数:5
- 供职机构:天津大学电气与自动化工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于SOM网络的随机映射文本降维方法被引量:6
- 2004年
- 文中针对在文本处理的高维矢量环境中Kohonen自组织特征映射神经网络的计算瓶颈问题进行分析,引入RM(随机映射)方法并进行相应的理论分析,在此基础上提出可以运用RM方法有效并且可控地解决上述计算瓶颈问题,降低了文本处理环境中Kohonen神经网络的规模和时间、空间代价。文章通过实验证明了上述方法的有效性和正确性,从而达到提高自组织理论对于文本处理的实时性和实际可行性的目的,并对其进一步应用进行展望。
- 钱晓东王正欧
- 关键词:文本处理自组织神经网络
- 文本处理中基于随机映射的加速LSI方法被引量:1
- 2005年
- 首先针对在文本处理的高维矢量环境中Kohonen自组织映射神经网络的计算瓶颈问题和输入矢量空间中存在的问题进行分析,然后对随机映射(RM)和隐含语义索引(LSI)方法分别进行理论分析,提出用于文本处理的基于随机映射的加速LSI方法.试验结果表明,加速LSI方法可以在凸现原有语义联系的基础上,低代价、有效、可控地解决上述问题,极大地降低文本处理环境中Kohonen自组织神经网络的规模和计算代价.
- 钱晓东王正欧
- 关键词:文本处理隐含语义索引自组织神经网络
- 数据挖掘中分类方法综述被引量:42
- 2007年
- 对数据挖掘中的核心技术分类算法的内容及其研究现状进行综述。认为分类算法大体可分为传统分类算法和基于软计算的分类法两类,主要包括相似函数、关联规则分类算法、K近邻分类算法、决策树分类算法、贝叶斯分类算法和基于模糊逻辑、遗传算法、粗糙集和神经网络的分类算法。通过论述以上算法优缺点和应用范围,研究者对已有算法的改进有所了解,以便在应用中选择相应的分类算法。
- 钱晓东
- 关键词:数据挖掘软计算
- ART2神经网络聚类的改进研究被引量:5
- 2007年
- 为进行快速动态层次聚类,通过分析自适应谐振理论(adaptive resonance theory,ART)神经网络的快速学习、主观设置警戒参数、输出无层次结构等优缺点以及自组织特征映射(self-or-ganizing feature map,SOFM)神经网络的侧反馈、不能动态聚类、输出无层次结构等优缺点的基础上,借鉴Hebb规则的思想,针对ART2神经网络的聚类算法进行了改进研究。通过结构描述、算法分析,该算法融合了ART2和SOFM的优点,克服其不足之处,以快速学习的方式形成可带有多层层次的动态聚类结构(不同的层次代表不同粒度的聚类),此外还降低了对警戒参数主观设置的要求,对于较粗粒度的聚类不再需要重新训练神经网络。并通过仿真实验证明该算法的有效性。
- 钱晓东王正欧
- 关键词:自适应谐振理论神经网络聚类自组织特征映射
- 基于神经网络等技术的数据与文本聚分类研究
- 本论文提出了四种基于ART2神经网络的用于数据聚类的改进算法,克服了经典ART2神经网络输出无层次结构的缺点,均可形成动态的层次聚类结果,同时降低了警戒参数主观设置的要求。
基于模、相位、空间密度的改进ART2...
- 钱晓东
- 关键词:数据聚类文本挖掘
- 基于神经网络文本检索词的语义扩充被引量:6
- 2004年
- 在讨论文本数据和文本检索特点的基础上,提出了一种运用神经网络进行检索词语义扩充的基本方法,对其中的检索词矢量化问题提出了一种方法,重点阐述在语义扩充中选择LVQ神经网络的原因、LVQ网络的修正学习算法和有关补充说明,最后给出实证证明神经网络方法进行检索词语义扩充的可行性。
- 钱晓东王正欧
- 关键词:文本检索矢量化LVQ
- 基于算法改进的ART2数据聚类方法研究被引量:3
- 2006年
- 为提高聚类精度和产生更多类别相关信息,在分析了传统聚类方法对最初样本集过分依赖,不能动态适应样本空间变化,不能动态决定聚类数目等不足后,通过介绍其特性和优点提出应用自适应谐振神经网络(ART2)作为聚类算法;针对经典ART2模型的主观设置警戒参数、输出无组织等不足,提出基于改进算法的ART2模型用于聚类分析;通过自组织、迭代、加权等过程推导合理类别的聚类所需要的警戒参数,仿真实验证明了本算法的有效性.
- 钱晓东王正欧
- 关键词:自适应谐振神经网络聚类
- 基于改进KNN的文本分类方法被引量:36
- 2005年
- 本文针对VSM (向量空间模型)中KNN (K最近邻算法)在文本处理环境下的不足,根据SOM (自组织映射神经网络)理论、特征选取和模式聚合理论,提出了一种改进的KNN文本分类方法。应用特征选取和模式聚合理论以降低特征空间维数。传统的VSM模型各维相同的权重并不适应于文本处理的环境,本文提出应用SOM神经网络进行VSM模型各维权重的计算。结合两种改进,有效地降低了向量空间的维数,提高了文本分类的精度和速度。
- 钱晓东王正欧
- 关键词:文本分类自组织神经网络向量空间模型K最近邻算法
- 基于遗传算法的ART2神经网络数据集优化被引量:3
- 2007年
- 为了提高小样本集情况下自适应谐振(ART)神经网络聚类的可靠性,提出了基于遗传算法的ART2神经网络训练集优化算法,克服了ART1神经网络编码的稳定性尚未完全解决和只能接受二进制模式的缺陷.利用遗传算法的全局寻优能力,通过对训练样本集添加适当的边界样本点,并将边界样本点和原样本集有机结合,以提高ART2神经网络的泛化性能.对ART2神经网络聚类算法的适当变更,以适应样本集的变化情况,并避免ART神经网络在不同训练阶段产生不同的聚类结果.实验证明,采用本算法后,ART2神经网络的聚类准确度可提高30%.
- 钱晓东王煜王化祥
- 关键词:自适应谐振神经网络遗传算法聚类