王春娟
- 作品数:4 被引量:22H指数:1
- 供职机构:湖南农业大学生物安全科学技术学院更多>>
- 发文基金:教育部“新世纪优秀人才支持计划”国家自然科学基金更多>>
- 相关领域:生物学理学医药卫生更多>>
- Multi-KNN-SVR组合预测在含氟化合物QSAR研究中的应用被引量:20
- 2008年
- 为深入认识含氟农药生物活性与其结构之间的关系,建立了理想的QSAR模型,从化合物油水分配系数等7个分子结构描述符出发,基于支持向量回归(SVR)和MSE最小原则,经自动寻找最优核函数和非线性筛选描述符,构建了多个K-最近邻(KNN)预测子模型.再经非线性筛选获得保留子模型,以保留子模型实施组合预测(Multi-KNN-SVR).33种含氟化合物对5种不同病害生物活性的留一法组合预测结果表明,采用非线性筛选描述符和KNN子模型能有效地提高预测精度,基于多个KNN子模型的非线性组合能进一步提高预测性能.Multi-KNN-SVR组合预测在QSAR以及其它相关预测研究中具有广泛应用前景.
- 谭显胜袁哲明周铁军王春娟熊洁仪
- 关键词:含氟化合物定量构效关系K-最近邻组合预测
- 数据挖掘在分子系统发生与定量构效关系建模中的应用
- 随着存储技术和Internet的迅猛发展,各行业数据量急剧增多,迫切需求更强有力的工具来“挖掘”有用信息,数据挖掘技术应运而生,目前已在各个领域获得广泛地应用。本文从数据挖掘无监督学习(聚类-以分子系统发生分析为例)和有...
- 王春娟
- 关键词:数据挖掘系统发生分析支持向量机回归K-最近邻
- 文献传递
- 支持向量机及组合预测在蛋白质四级结构分类中的应用被引量:1
- 2008年
- 目的:基于支持向量机建立一个自动化识别新肽链四级结构的方法,提高现有方法的识别精度。方法:改进4种已有的蛋白质一级序列特征值提取方法,采用线性和非线性组合预测方法建立一个有效的组合预测模型。结果:以同源二聚体及非同源二聚体为例,对4种特征值提取方法进行改进后其分类精度均提升了2~3%;进一步实施线性与非线性组合预测后,其分类精度再次提高了2~3%,使独立测试集的分类精度达到了90%以上。结论:4种特征值提取方法均较好地反应出蛋白质一级序列包含四级结构信息,组合预测方法能有效地集多种特征值提取方法优势于一体。
- 谭显胜袁哲明周铁军熊洁仪王春娟
- 关键词:支持向量机组合预测
- 头孢菌素类抗生素的定量构效关系研究被引量:1
- 2007年
- 目的:建立一种预测精度较高的定量构效关系(QSAR)模型,为设计和合成活性更高的头孢菌素类抗生素提供理论依据。方法:发展了一种基于支持向量回归(SVR)和k-最近邻(KNN)的非线性组合预测方法(SVR-KNN),系统研究了48种抗流感嗜血杆菌头孢菌素衍生物的QSAR。结果:留一法预测结果表明,非线性筛选描述符和子模型能明显提高预测精度,汰选子模型后的组合预测精度优于单一子模型,SVR-KNN的MSE、MAPE分别为0.019、1.81%;独立样本预测结果显示,SVR-KNN在所有参比模型中具有最优的预测精度及稳定性,其MSE、MAPE分别为0.010、1.33%。结论:SVR-KNN模型具有较强的预测能力和优异的泛化推广能力,在抗生素及其他药物的QSAR研究中有广泛应用前景。
- 王春娟谭显胜袁哲明熊洁仪
- 关键词:头孢菌素类抗生素