国家自然科学基金(60673009)
- 作品数:5 被引量:33H指数:5
- 相关作者:黄亚楼谢茂强王扬刘杰李栋更多>>
- 相关机构:南开大学大连理工大学微软公司更多>>
- 发文基金:国家自然科学基金天津市科技攻关计划教育部“新世纪优秀人才支持计划”更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于距离尺度学习的新类识别方法被引量:6
- 2009年
- 在在线分类任务中经常会出现新类别,导致数据分布发生显著变化,使得已有分类器不再适用.如何识别新类以使分类器能适应其出现已成为在线分类亟待解决的问题.本文提出基于距离尺度学习的识别偏离型新类的算法用于解决该问题.该方法能在缺少先验知识的前提下自动识别新类,并较好地解决了样本间类别相似性同样本间距离不一致的问题,为分类器的自适应更新提供了关键技术.在多个数据集上的实验结果表明在客观新类出现后该方法能有效发现新类,可使更新后的分类器保持较高准确度,为实现适应新类的在线分类系统奠定坚实基础.
- 谢茂强黄亚楼殷爱茹江皞李栋
- 关键词:自适应分类
- 基于L_p范数的局部自适应偏微分方程图像恢复被引量:10
- 2008年
- 提出了一种新的基于L_p范数的自适应偏微分方程图像处理模型,改进了Tony Chan的TV变分模型和张红英的p-Laplace模型.TV模型对图像采用全局约束,而新的扩散方程在图像不同的位置上采用不同的约束,具有局部自适应的特性,在扩散的同时更好地保持了图像的边缘信息,进而将其应用到图像恢复(去噪,去除模糊)中去.实验结果表明新模型的综合性能优于Tony Chan和张等现有的模型.
- 李波苏志勋刘秀平
- 多查询相关的排序支持向量机融合算法被引量:7
- 2011年
- 排序学习是目前信息检索与机器学习领域研究的热点问题.现有排序学习算法在学习时把训练样本集中的所有查询及其相关文档等同对待,忽视了查询之间的差异,影响了排序模型的性能.对查询之间的差异进行描述,并在训练过程中考虑这种差异,提出一种基于有监督学习的融合多个与查询相关排序子模型的方法.该方法为每一个查询及其相关文档建立一个子排序模型,并将子排序模型的输出进行向量化表示,将多个查询相关的排序模型转化为体现查询差异的特征数据,实现多排序模型的集成.以排序支持向量机为例,在查询级和样本级建立新的损失函数作为优化目标,并利用此损失函数调节不同查询产生损失之间的权重,提出多查询相关的排序支持向量机融合算法.在文档检索和网页检索中的实验结果表明,使用多查询相关的排序支持向量机融合算法可以取得比传统排序学习模型更好的性能.
- 王扬黄亚楼谢茂强刘杰卢敏廖振
- 关键词:信息检索
- 基于PRank算法的主动排序学习算法被引量:5
- 2008年
- 针对排序学习中如何选择最值得标注的样本和通过尽可能少的已标注样本训练出较好的排序模型的问题,将主动学习的思想引入排序学习中,提出一种基于排序感知机的主动排序学习算法——Active PRank。基于真实数据集的实验结果表明,该算法在保证排序模型性能的前提下,减少样本的标注量,在同等标注量的条件下,提高排序结果的正确率。
- 王扬黄亚楼刘杰李栋蒯宇豪
- 基于排序支持向量机的缩略词自动提取方法被引量:5
- 2008年
- 针对网络文本中缩略词及其对应解释的提取,提出基于排序支持向量机的缩略词自动提取算法.通过构建两步排序模型,从局部提取到全局排序提取得到缩略词同时返回它所对应候选解释的排序列(最准确、使用最普及的解释排在最前),由此来剔除反例,使用户较容易找到真正的解释.实验结果表明本文算法在准确性和不同领域适应性上都优于已有方法.
- 高永梅黄亚楼倪维健徐君
- 关键词:信息检索