山西高校科技研究开发项目(20101120)
- 作品数:2 被引量:8H指数:1
- 相关作者:胡志军李荣郑家恒王鸿斌更多>>
- 相关机构:忻州师范学院山西大学更多>>
- 发文基金:山西高校科技研究开发项目国家自然科学基金山西省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于随机中心距离排序的支持向量预选取方法
- 2013年
- 提出了一种基于随机中心距离排序的支持向量预选取方法.对于线性可分情况,该方法首先从每一个类别中随机选取一定数目的样本计算均值,并把该均值作为该类别样本的随机中心,然后对每一个样本计算它与另一类样本随机中心之间的距离,最后选择一定数目具有较小随机中心距离的原始样本组成边界样本集.对于非线性可分情况,此算法借助于核函数将原始问题映射到特征空间,然后再按照线性可分情况求解.由于支持向量往往分布在两类样本相邻的边界区域,因此此方法可以较为精确地预选取支持向量.在部分UCI标准数据集和ORL人脸数据库上的实验说明此算法较以往支持向量预选取算法可以更为快速准确地进行支持向量预选取.
- 胡志军王鸿斌李荣
- 关键词:支持向量预选取
- 基于遗传算法和隐马尔可夫模型的Web信息抽取的改进被引量:8
- 2012年
- 为了进一步提高Web信息抽取的准确性和效率,针对Web信息抽取的遗传算法和一阶隐马尔可夫模型混合方法在初值选取和参数寻优上的不足,提出了一种遗传算法和二阶隐马尔可夫模型内嵌结合的改进方法。在分层预处理阶段,利用格式信息和文本特征将文本切分成文本行、块或单个的词等恰当的层次;然后采用内嵌的遗传算法和二阶隐马尔可夫混合模型训练参数,保留最优和次优染色体,修正Baum-Welch算法的初始参数,多次使用遗传算法微调二阶隐马尔可夫模型;最后用改进的Viterbi算法实现Web信息抽取。实验结果表明,改进方法在精确度、召回率指标和时间性能上均比遗传算法和一阶隐马尔可夫模型的混合方法具有更好的性能。
- 李荣胡志军郑家恒
- 关键词:WEB信息抽取遗传算法