许红涛
- 作品数:7 被引量:40H指数:4
- 供职机构:复旦大学计算机科学技术学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划河南省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于eEPs的中文文本自动分类算法
- 为了能够有效地组织和分析海量的Web信息资源,帮助用户迅速地获取所需要的知识和信息,人们希望能够按照内容实现对网页的自动分类。Web的迅猛发展为文本自动分类技术提供了一个前所未有的实验环境和应用平台,同时也带来了新的挑战...
- 许红涛
- 关键词:中文文本特征提取文档频率
- 文献传递
- 一种自适应的Web图像语义自动标注方法被引量:16
- 2010年
- 提出了一种自适应的Web图像语义自动标注方法:首先利用Web标签资源自动获取训练数据;然后通过带约束的分段惩罚加权回归模型将关联文本权重分布自适应学习和先验知识约束有机地结合在一起,实现Web图像语义的自动标注.在4000幅从Web获得的图像数据集上的实验结果验证了该文自动获取训练集方法以及Web图像语义标注方法的有效性.
- 许红涛周向东向宇施伯乐
- 关键词:图像检索
- 基于扩展生成语言模型的图像自动标注方法被引量:14
- 2008年
- 使用最大权匹配算法,结合统计平滑技术,提出图像区域特征生成概率估计方法,并进一步对训练集中标注词之间的语义相关性(correlation)进行分析与度量,给出一种基于生成模型的图像标注算法.算法使用所提出的基于最大权匹配的图像生成概率估计方法得到较好的起始点,进而设计启发式迭代函数对词与词的相关性加以利用,最终提高标注词与图像的语义相关性.在现实世界图像数据库上的实验结果验证了所提出标注方法的有效性.
- 王梅周向东张军旗许红涛施伯乐
- 关键词:图像标注语义相关性
- Web图像语义分析与自动标注研究
- Web图像通常关联着多种不同类型的信息,如图像本身的视觉特征(颜色、纹理、形状等)、关联的文本信息等,其语义内容或多或少地都与这些关联信息有关。图像的视觉特征空间和语义概念空间之间存在着巨大的“语义鸿沟”,使得基于视觉内...
- 许红涛
- 关键词:WEB图像语义分析自适应学习信息搜索
- 基于可判别超平面树的生成模型图像标注方法被引量:4
- 2009年
- 图像语义的自动标注是一个具有挑战性的研究课题,目前常见的机器学习方法,如统计生成模型(generative model)与判别模型(discriminative model)都被用于该问题的研究中.然而由于语义鸿沟的存在、图像训练数据的不平衡性以及图像标注的多标签特性等问题,使得上述方法的性能都有待进一步提高.提出一种基于可判别超平面树的生成模型图像标注方法.该方法根据待标注目标图像的高生成概率邻域,建立局部超平面分类树,进而利用同层类间可判别信息,按自顶向下的层次分类得到待标注图像的语义相关图像集合.由此得到的相关类信息与新的生成模型框架相结合对待标注图像与语义关键词的联合概率进行估计,实现对目标图像的标注.其特点在于生成模型与判别模型方法得到了有效结合,可判别超平面树对隐含语义聚类的判别分析是对待标注图像的生成"邻域"的逐步求精过程,有效地提高了生成模型标注准确度;而对于判别分析难以解决的多标签分类、训练数据不平衡等问题,此方法通过联合概率估计自然地实现目标图像的多标签分配.在常用的包含5000幅图像的ECCV2002数据集进行了实验,结果表明,与目前已知的具有较好标注效果的基于生成模型的MBRM模型(采用图像分割方法)以及基于辨别分析的ASVM-MIL相比,此方法的F1因子分别提高了14%和13%.
- 王梅周向东许红涛施伯乐
- 关键词:自动图像标注
- 利用抽样技术和元学习的分布式关联规则挖掘算法被引量:7
- 2006年
- 结合动态项集计数技术和抽样的思想,利用元学习策略来产生频繁项集,提出了一个不共享内存的分布式关联规则挖掘算法DASM;引进了相似度的概念,并用之提高了挖掘的精确度。理论分析以及在IBM数据生成器生成的数据集上的实验均表明,DASM算法具有较高的挖掘效率和较低的通信量,适用于对效率要求较高的应用领域。
- 李梅花王黎明许红涛
- 关键词:元学习相似度分布式关联规则挖掘
- 一种基于EP的中文文本自动分类算法
- 文本自动分类具有广泛的实际应用.引进一种新的基于类内文档频率特征提取方法,并与基于EP的分类方法相结合,提出一种基于EP的中文文本自动分类算法TCEP.通过有效提取那些具有很好区分性能的词作为特征项,TCEP算法不仅大大...
- 许红涛范明昝红英
- 关键词:中文文本自动分类特征提取文档频率EP
- 文献传递