上海海事大学重点学科建设项目(XL0101)
- 作品数:5 被引量:31H指数:3
- 相关作者:高茂庭王正欧刘积芬陆鹏更多>>
- 相关机构:上海海事大学天津大学更多>>
- 发文基金:上海海事大学重点学科建设项目国家自然科学基金上海市教委科研基金更多>>
- 相关领域:自动化与计算机技术交通运输工程更多>>
- 基于LSA降维的RPCL文本聚类算法被引量:8
- 2006年
- 文本聚类中,存在诸如文本特征空间维数巨大、聚类的数目不能事先确定等问题。隐含语义分析方法可以对文本特征空间作降维处理并有效地凸现出文本和词条之间的语义关系;次胜者受罚竞争学习规则可以进行有效的聚类并自动确定适当的聚类数目。将这两种方法结合进行文本聚类可以在一定程度上解决维数和聚类数的问题,实验表明,这种方法能够收到较好的聚类效果,同时,实验还验证了向量余弦距离比欧氏距离方法更适合于文本相似度的计算。
- 高茂庭王正欧
- 关键词:文本聚类隐含语义分析聚类分析
- 带约束的装配生产计划及其数据模型设计被引量:3
- 2006年
- 生产计划的制订是企业生产的重要一环,往往要受到来自企业内外多种因素的影响,生产计划系统是制造执行系统的一个重要组成部分。通过分析生产计划中零部件生产厂家、库存数量、设备生产能力、人员生产能力等约束和限制,从技术上构造了系统相关数据模型,并提出装配生产计划系统数据结构模型的设计方案。
- 高茂庭刘积芬
- 关键词:制造执行系统资源受限
- 基于投影寻踪降维的文本特征可视化被引量:4
- 2008年
- 利用遗传算法优化投影方向,投影寻踪模型将高维的文本特征数据投影到2~3维的低维可视化空间上,并根据高维数据在这个低维空间当中的投影特征值来反映其线性和非线性结构或特征,达到数据降维目的并实现文本数据特征可视化。不仅大大约简了文本挖掘过程的计算复杂性,还有助于在K-means聚类算法中确定初始中心点数目,提高算法精度。实验验证了这种方法应用于文本特征降维的有效性。
- 高茂庭陆鹏
- 关键词:投影寻踪降维文本挖掘遗传算法
- 几种文本特征降维方法的比较分析被引量:18
- 2006年
- 文本挖掘中采用向量空间模型(VSM)来表达文本特征,表现出巨大的维数,从而导致处理过程计算复杂,为此,需要先对文本特征矩阵进行合理的降维处理。隐含语义分析(LSA)、概念索引(CI)、非负矩阵分解(NMF)和随机映射(RP)是几种有效的降维方法,在分析降维空间的含义和计算复杂度后,通过文本聚类实验比较和分析了这几种降维方法的差异,实验表明,这些方法不仅可以对文本特征空间作有效的降维处理,还能在不同程度上凸现文本和词条之间的语义关系,从而提高文本挖掘的效率和准确率。
- 高茂庭王正欧
- 关键词:文本挖掘降维非负矩阵分解隐含语义分析
- 船舶客运信息管理系统的设计与实现
- 2007年
- 针对船舶在客运管理中,航线、航班次数多、客流量大,手工信息处理复杂等问题,设计并实现了船舶客运信息管理系统,对客运船舶的站点、航线、航班、票价等基础信息以及客运售票、退票、预订等业务信息进行分析,并对售票、退票业务进行统计和核算。
- 高茂庭刘积芬
- 关键词:信息管理系统设计