陈渊
- 作品数:24 被引量:48H指数:4
- 供职机构:湖南农业大学更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金湖南省自然科学杰出青年基金更多>>
- 相关领域:生物学农业科学自动化与计算机技术理学更多>>
- 以“一口价”为上限的网约车合乘均衡计价方法
- 一种以“一口价”为上限的网约车合乘均衡计价方法,该方法是以“一口价”为上限实现乘客支付的动态调整,以乘客方的节省费用比率与司机收入增加比率相等的公平原则作为网约车合乘计价的评价基础,通过网约车合乘的历史数据来确定合适的λ...
- 陈渊袁哲明杨晶晶谭泗桥邢鹏伟张雪丽
- 文献传递
- 融合位置特征与序列进化信息的磷酸化位点预测(英文)被引量:1
- 2017年
- 磷酸化是蛋白质翻译后的主要修饰,可分为激酶特异性和非激酶特异性两种类型.以非激酶特异性磷酸化位点Dou数据集为基础,本文发展了一种基于位置的卡方差表特征χ~2-pos,融合伪氨基酸序列进化信息PsePSSM表征序列,构建正负样本均衡的支持向量机分类器,S,T,Y独立测试Matthew相关系数、ROC曲线下面积分及准确率分别达到了(0.59、0.87、79.74%),(0.55、0.85、77.68%)和(0.50、0.81、75.22%),明显优于文献报道结果.χ~2-pos、PsePSSM两种特征的融合在蛋白质磷酸化位点预测中有广泛应用前景.
- 谭泗桥李钎陈渊陈渊
- 关键词:磷酸化支持向量机
- 基于最大信息系数与冗余分摊的特征选择方法被引量:1
- 2020年
- 特征选择是机器学习的关键环节,通常采用最小冗余最大相关法进行特征选择,但该方法存在相关性测度与冗余性测度不可比、特征引入无法自动终止等问题。为此,提出一种基于最大信息系数(MIC)与冗余分摊策略的特征选择方法(MIC-share)。以MIC度量相关性测度与冗余性测度,采用冗余分摊策略获取新的特征得分,自动终止特征引入过程,减少最优子集确定所需时间。仿真结果表明,与PLSR、MIFS、KNN-FABC等特征选择方法相比,MIC-share方法得到的回归数据均方根误差更小,分类数据错误率更低。
- 袁哲明杨晶晶陈渊
- 关键词:支持向量机
- 一种全自动二化螟智能监测装置
- 本发明公开了一种全自动二化螟智能监测装置,涉及二化螟监测设备技术领域,其技术方案是:包括集虫桶,所述集虫桶用于存储诱捕到的二化螟,所述集虫桶左侧外壁开设有杀虫芯卡槽,所述杀虫芯卡槽用于存放杀虫剂,所述杀虫剂用于对进入集虫...
- 陈渊范稼琦刘琪琪谭泗桥袁哲明
- 一种多类别图像识别方法及系统
- 本发明公开了一种多类别图像识别方法及系统,对m类别图像识别问题C={C1,C2,…,Cw,…,Cm},将选自图像识别数据集的训练样本分解为m套样本子集;对每套样本子集经特征选择获得一套特征子集,共获得m套特征子集{Fea...
- 陈渊袁哲明杨晶晶谭泗桥杨黎
- 文献传递
- 基于支持向量回归与地统计学的农民收入预测被引量:3
- 2014年
- 农民收入既受其自身动态时序特性的影响,又与国家政策、农产品产量、天气等多种人为因素和自然因素关系密切,是一种典型的多维时间序列数据.该研究以国民总收入、乡村人口等11个可能与农民收入相关的影响因子为自变量,农村居民家庭平均每人纯收入为因变量,基于1982~2011年我国相关统计数据,采用支持向量回归与地统计学非线性时间序列预测模型对农民收入进行分析.结果表明:非线性时间序列预测模型大幅度提高了农民收入预测精度;农民的主要收入来源已不是粮食生产,而是向其他农业生产、进城务工等方面转移.
- 张弘杨陈渊袁哲明
- 关键词:农民收入地统计学支持向量机
- 基于统计差表与加权投票的高精度剪接位点预测
- 2019年
- 基于机器学习的高精度剪接位点识别是真核生物基因组注释的关键.本文采用卡方测验确定序列窗口长度,构建卡方统计差表提取位置特征,并结合碱基二联体频次表征序列;针对剪接位点正负样本高度不均衡这一情形,构建10个正负样本均衡的支持向量机分类器,进行加权投票决策,有效解决了不平衡模式分类问题. HS^3D数据集上的独立测试结果显示,供体、受体位点预测准确率分别达到93.39%、90.46%,明显高于参比方法.基于卡方统计差表的位置特征能有效表征DNA序列,在分子序列信号位点识别中具有应用前景.
- 曾莹曾莹陈渊
- 关键词:剪接位点支持向量机
- 改进支持向量机及其应用
- 以统计学习理论为基础的支持向量机(Support Vector Machine, SVM)是机器学习领域的集大成者,包括支持向量分类(Support vector classify, SVC)和支持向量回归(Suppor...
- 陈渊
- 关键词:支持向量机K近邻定量构效关系
- 文献传递
- 有监督学习关键问题算法创新与应用
- 袁哲明周玮张红燕代志军王立峰陈渊
- 信息与大数据时代并不缺乏数据,缺少的是对数据深入分析、获取知识的有效算法。有监督学习广泛见于生物信息学、模式识别与预测等多个领域。对单因变量、多自变量非纵向数据集(y<,i>,x<,i,j>),i=1,2,…,n;j=1...
- 关键词:
- 关键词:生物信息学有监督学习
- 基于序列特征筛选与支持向量回归预测蛋白质折叠速率被引量:1
- 2014年
- 折叠速率预测对阐明蛋白质折叠机理意义重大.本文收集了115条目前已知折叠速率的蛋白质样本(包括二态、多态和混态蛋白),为了较全面地表征蛋白质分子的一级结构信息,提取序列长度、氨基酸残基多尺度组分、成对残基k-space特征与基于残基物理化学性质的地统计学关联总共9357维特征.经改进的二元矩阵重排过滤器和多轮末尾淘汰非线性筛选,获得23个物理化学意义明确的保留特征,建立的非线性支持向量回归模型Jackknife交叉验证的相关系数R=0.95,优于文献报道及其他参比特征选择方法.支持向量回归解释体系表明折叠速率与保留描述符的非线性回归极显著,分析了各保留描述符对折叠速率的影响,结果表明蛋白质折叠速率与序列长度、中短程关联特征、三联体残基组份特征等密切相关.
- 李咏周玮代志军陈渊王志明袁哲明
- 关键词:蛋白质折叠支持向量回归