赵南
- 作品数:8 被引量:18H指数:3
- 供职机构:南京农业大学信息科学技术学院更多>>
- 发文基金:中央高校基本科研业务费专项资金江苏省自然科学基金国家科技支撑计划更多>>
- 相关领域:生物学自动化与计算机技术更多>>
- 空间密度相似性度量K‑means聚类方法
- 本发明公开了一种空间密度相似性度量K‑means聚类方法,其特征在于该方法采用将空间密度的相似性距离和新的K‑means方法类中心的迭代模型相结合的方法,来改进单一的欧氏距离测量方法和K‑means的迭代规则。本发明的聚...
- 薛卫杨荣丽赵南徐焕良任守纲
- 文献传递
- 蛋白质亚细胞定位预测研究
- 研究蛋白质亚细胞定位对了解细胞生命活动、推断未知特性蛋白质功能、诊断疾病和研制新药等具有重要作用。随着生物信息学的兴起、发展,蛋白质序列数据大规模产生,大量蛋白质亚细胞定位预测方法被提出。本文引入词袋模型对传统的蛋白质序...
- 赵南
- 关键词:亚细胞定位粒子群算法细菌觅食支持向量机
- 一种用最近邻检索实现的蛋白质亚细胞定位预测方法
- 一种用最近邻检索实现的蛋白质亚细胞定位预测方法,该方法包括以下步骤:(1)、以AAC特征向量作为蛋白序列的特征,用LSH方法将训练集中的各蛋白序列的AAC特征向量存放在多个哈希表中;(2)、预测时,用LSH方法计算出目标...
- 薛卫王雄飞赵南任守纲
- 文献传递
- 集成改进KNN算法预测蛋白质亚细胞定位被引量:3
- 2017年
- 基于Adaboost算法对多个相似性比对K最近邻(K-nearest neighbor,KNN)分类器集成实现蛋白质的亚细胞定位预测。相似性比对KNN算法分别以氨基酸组成、二肽、伪氨基酸组成为蛋白序列特征,在KNN的决策阶段使用Blast比对决定蛋白质的亚细胞定位。在Jackknife检验下,Adaboost集成分类算法提取3种蛋白序列特征,3种特征在数据集CH317和Gram1253的最高预测成功率分别为92.4%和93.1%。结果表明Adaboost集成改进KNN分类预测方法是一种有效的蛋白质亚细胞定位预测方法。
- 薛卫王雄飞赵南杨荣丽洪晓宇
- 关键词:NEIGHBORALIGNMENTADABOOST
- 相似性比对预测蛋白质亚细胞区间被引量:1
- 2016年
- 【目的】对蛋白质所属的亚细胞区间进行预测,为进一步研究蛋白质的生物学功能提供基础。【方法】以蛋白质序列的氨基酸组成、二肽、伪氨基酸组成作为序列特征,用BLAST比对改进K最近邻分类算法(K-nearest neighbor,KNN)实现蛋白序列所属亚细胞区间预测。【结果】在Jackknife检验下,数据集CH317三种特征的成功率分别为91.5%、91.5%和89.3%,数据集ZD98成功率分别为93.9%、92.9%和89.8%。【结论】BLAST比对改进KNN算法是预测蛋白质亚细胞区间的一种有效方法。
- 王雄飞张梁薛卫赵南徐焕良
- 关键词:KNNBLAST
- 词袋模型在蛋白质亚细胞定位预测中的应用被引量:5
- 2017年
- 运用词袋模型结合传统的蛋白质特征提取算法提取蛋白质序列特征,采用K-means算法构建字典,计算获得蛋白质序列的词袋特征,最终将提取的特征值送入SVM多类分类器,对数据集中蛋白质的亚细胞位置进行预测,在一定程度上提高了亚细胞定位预测的准确率。
- 赵南张梁薛卫王雄飞任守纲
- 关键词:K-MEANS支持向量机
- 空间密度相似性度量K-means算法被引量:13
- 2018年
- 传统K-means算法的缺陷有初始聚类中心选择的不稳定、聚类效果对初始聚类中心过于依赖、非簇型数据集分类效果不佳等问题.为克服以上不足,本文提出空间密度相似性度量K-means算法.该算法采用可伸缩空间密度的相似性距离度量数据点间的相似度,并将密度和距离共同作为选择新初始聚类中心的相关因子,以及根据类内距离进行迭代的一种新的类中心迭代模型.在非簇型人工数据集和UCI标准数据集上的实验证明,与传统及其他改进K-means算法相比,本文提出的算法可得到更加合理的初始聚类中心,能反映任意形状的复杂数据集分布规律,算法更加稳定、准确.
- 薛卫杨荣丽赵南徐焕良任守纲
- 关键词:K-MEANS初始聚类中心
- 一种用最近邻检索实现的蛋白质亚细胞定位预测方法
- 一种用最近邻检索实现的蛋白质亚细胞定位预测方法,该方法包括以下步骤:(1)、以AAC特征向量作为蛋白序列的特征,用LSH方法将训练集中的各蛋白序列的AAC特征向量存放在多个哈希表中;(2)、预测时,用LSH方法计算出目标...
- 薛卫王雄飞赵南任守纲
- 文献传递