业宁 作品数:112 被引量:530 H指数:13 供职机构: 南京林业大学信息科学技术学院 更多>> 发文基金: 江苏省自然科学基金 国家自然科学基金 江苏省“青蓝工程”基金 更多>> 相关领域: 自动化与计算机技术 农业科学 理学 文化科学 更多>>
基于分而治之策略的稀疏张量多层次数据挖掘 分析了MET算法的局限性以及out-of-core方法的特点,融合了两种算法的思想提出一种基于分而治之策略的多层次数据挖掘算法(DRMET),避免了计算过程中可能造成的维数灾难问题,克服了MET算法执行效率不高的缺陷,同... 周溜溜 业宁 徐异 严敏利 孙伟关键词:时间开销 结肠癌基因表达谱的特征选取研究 被引量:1 2012年 为了找到与结肠癌相关的基因,提高结肠癌样本的识别率,提出了基于Chernoff距离的浮动顺序搜索算法(sequential floating search method,SFSM)。通过对结肠癌基因表达谱数据集的分析,对每个基因进行评价和筛选;对筛选后的基因子集利用SFSM算法进行搜索,并以Chernoff距离作为其评估函数,生成若干候选特征基因子集;利用支持向量机(support vector machine,SVM)、K-近邻(K-nearest neighbor,KNN)和径向基(radical basis function,RBF)神经网络分类器来检验候选特征基因子集的分类效果。实验结果表明,利用SFSM及评估函数Chernoff距离发现在参数β=0.25时能找到最佳的特征基因组合,该组合能以很高的正确率识别结肠癌样本。 潘冬寅 朱发 徐昇 业宁关键词:支持向量机 K-近邻 径向基神经网络 现代信息数据的挖掘与发展 被引量:4 2003年 数据挖掘作为一项从海量数据中提取知识的新技术引起学术界和产业界的极大重视。笔者概括了数据挖掘的几种常见模式,如依赖模式、层次模式、序列模式等,并对这几种数据挖掘模式的特点进行了比较;阐述了从数据中提取知识的几种挖掘算法,如决策树、神经网络方法、遗传算法等;展望了数据挖掘模式和挖掘算法的发展趋势。 业宁 董逸生 张爱珍关键词:数据挖掘 神经网络 遗传算法 基于图像模式识别技术的牛顿环检测 被引量:13 2003年 利用图像模式识别技术对牛顿环条纹进行自动识别 ,不仅速度快、精度高 。 张爱珍 业宁关键词:图像模式识别 CCD 计算机图像处理 物理实验 基于邻接自适应谱聚类的木材表面缺陷分割算法 2024年 针对人工分割木材表面缺陷的烦琐性和阈值分割算法对缺陷像素信息衡量的不稳定性,提出了一种基于邻接自适应谱聚类的木材表面缺陷分割算法。算法以简单线性迭代超像素(simple linear iterative cluster, SLIC)为基础,对缺陷图像进行预处理,融合木材缺陷的纹理特性和超像素块间的距离尺度,并采用邻接自适应谱聚类进行分割;缺陷分割初步完成后,通过变异系数衡量缺陷块中像素信息的离散程度进行再次分割,克服初次分割结果的过分割问题;考虑木材表面缺陷形态学上的封闭性,将2次分割图像进行合并,继而用邻接扫描法对次分割图形进行填充,最终对木材表面缺陷进行分割界定。考虑木材表面缺陷种类的多样性,选取了虫眼、死节、活节等缺陷图像进行分割对比试验,相较于OTSU阈值分割算法,本研究算法在单个和多个木材表面缺陷分割方面,类别平均像素准确度(mean pixel accuaracy, MPA)分别提升4.69%,14.23%,平均交并比(mean intersection over union, mIoU)分别提升33.27%,33.43%。本研究算法能够更加准确地将木材表面缺陷从复杂背景中分割出来,缺陷边缘轮廓的构建更接近于理想分割情况,且运行时间较短,对木材表面缺陷的分割具备较强的精确性与可行性。 魏子腾 业宁关键词:图像分割 带约束最长公共子序列快速算法 被引量:7 2009年 带约束最长公共子序列(CLCS)问题有很深的生物学应用背景,常被用来表示同源基因序列相似性的度量,但计算CLCS时间代价很高,最早的CLCS算法的时间复杂度为O(rn4),目前,最快的CLCS算法的时间复杂性为O(rn2).运用对偶原理将带约束最长公共子序列问题转换为带约束最小覆盖集问题,并建立带权的ref树结构,构造包含约束序列的约束覆盖子集,约简带约束覆盖子集并从中搜索关键路径,再通过关键路径构造CLCS,该算法将算法时间复杂度提升到O(nlogn+(q+r)L),r是约束序列的长度,q是两序列序偶的个数,L是两序列的最长公共子序列(LCS)长度. 业宁 朱大铭 张倩倩 沈丽容关键词:对偶算法 子模式判别型半监督非线性维数减少算法 被引量:1 2009年 维数减少是在损失较少特征信息的条件下处理高维图像数据的关键技术,已成为高维数据处理中的热点问题.样本的类内和类间散度判别信息被用于判断当前样本对属于相同类还是不同类,同时考虑未标签样本对算法性能的影响,提出了一种判别型半监督非线性维数减少算法(discriminativesemi-supervised nonlinear dimensionality reduction,DSSNDR),可有效避免奇异性.DSSNDR采用高斯核和多项式核组合得到的混合核,将原始数据以一系列"有用的"特征形式投影到一个较低维的嵌入空间,便于分类,同时能够保持已标签和未标签样本的内部特征,可有效执行半监督学习.引入样本数据的子模式,将DSSNDR推广到子模式特征空间下的非线性方法,简称Sp-DSSNDR,进一步增强了DSSNDR的学习能力,提高分类精度.多个典型数据集上的分类和可视化实验表明,不同类的样本数据的投影在DSSNDR和Sp-DSSNDR构造的特征空间中存在较少的混叠现象,具有更好的可分离性.当维数被减少到较低水平时,本文算法几乎总是取得最好的结果,甚至超过了经典的主成分分析(PCA),核主成分分析(KPCA)和核Fisher判别分析(KFD)算法. 张召 业宁 杜辉 沈丽容 张贤涛关键词:半监督学习 子模式 特征子空间 基于对gSpan改进的有向频繁子图挖掘算法 被引量:2 2011年 提出的新算法对gSpan算法做了适用性改进,算法所采用的图编码技术与传统的频繁子图挖掘(FSG),快速频繁子图挖掘(FFSM),基于先验的图挖掘(AGM)等算法对图结构的编码均不同,由于对有向图进行了新的二维特征定义,因此可使算法适用范围有效地扩展至对有向图的学习,称之为基于对gSpan改进的有向频繁子图挖掘算法(DFSS);因目前为止,一系列频繁子图的挖掘大都是基于无向图上的知识发现,对直接作用于有向图的挖掘尚且很少.并且所设计算法较先前基于Apriori思想的FSG,AGM等一系列频繁图挖掘算法,在时间复杂度方面有了一定程度的改进,使得挖掘效率得以提升;实验结果表明在不损失挖掘完整度的前提下,其效率是FFSM算法的70~80倍. 周溜溜 业宁关键词:频繁子图 基于修剪树的优化聚类中心算法 被引量:1 2021年 针对传统聚类算法存在样本形状及孤立点敏感的问题,提出基于修剪树的优化聚类中心(Optimized Clustering Center Based on Trimmed Tree,OCT)算法.该算法自适应地寻找裁剪尺寸来修剪并分割最小生成树为森林,获取森林全部叶子结点并再次构造最小生成树,根据预设簇数n,修剪最小生成树的n-1条最长边,得到包含n棵树的森林,计算森林中每棵树的质心并将其置为初始类簇聚类中心.在仿真数据集和真实数据集上的测试结果表明,OTC算法的平均识别率分别为98.8%和95.7%,平均耗时为57 ms和10.53 ms. 周小亮 吴东洋 曹磊 王玉鹏 业宁关键词:最小生成树 聚类分析 基于纹理提取和SVM技术的自动木材缺陷识别 被引量:12 2009年 支持向量机(SVM)是一种新的模式识别方法,有较好的泛化能力和推广能力。研究了基于纹理提取和支持向量机的自动木材表面缺陷的识别问题,借助LBP纹理特征提取技术实现对木材图像数据降维处理,并研究了木材表面不同类型缺陷的分布规律。利用支持向量机分类算法对木材表面有无缺陷进行了快速准确的自动识别,实现了木材表面缺陷的自动定位。多次交叉实验表明,SVM分类算法对木材表面缺陷具有较好的识别能力,识别率可达96%以上。 张召 业宁 业巧林关键词:支持向量机 木材缺陷