天津市自然科学基金(05YFJMJC01500)
- 作品数:5 被引量:30H指数:2
- 相关作者:史广顺王庆人杨巨峰王恺王立更多>>
- 相关机构:南开大学天津理工大学天津大学更多>>
- 发文基金:天津市自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术更多>>
- 联机手写化学公式识别与分析被引量:2
- 2010年
- 随着移动设备的日渐普及,联机手写输入方式为化学知识的使用和分享提供了可能,而化学公式的数字化处理也逐渐成为热点。为了有效进行联机手写化学公式的识别,通过整理6种化学公式中常见的符号位置关系,提出了一种用于联机手写化学公式识别与分析的方法,该方法在处理了断笔、粘连、连笔等书写异常情况后,完成了对化学公式的切分。识别时,先利用SVM+HMM的两级分类机制识别独立的化学符号;然后以公式的语义和语法规则协助理解用户的书写原意。实验证明,该方法应用于平板电脑,对于上述3个阶段的化学公式识别均取得了理想的结果,从而为联机手写化学公式重现和重用打下了基础。
- 杨巨峰史广顺王恺
- 数学公式图像的结构理解与重现被引量:2
- 2008年
- 数学公式图像识别与理解是文档图像处理领域的重要组成部分,目前尚无满足一般应用的处理方法.提出了一种鲁棒的数学公式结构理解方法,使用公式图像识别结果、语法规则和句法规则分析数学公式结构,对数学公式的类型进行了完整的划分,对识别结果的错误进行自动的检查和纠正,能够自动分析数学公式符号的优先级和计算顺序.既可以应用于数学公式图像的识别与格式转换,也可应用于对数学公式的检索和辅助编辑.基于1 000个真实公式图像的实验结果证明了分析方法的有效性和稳定性.
- 史广顺肖萃王庆人
- 基于规则集的Deep Web信息检索被引量:1
- 2008年
- 提出一种基于规则集的新型Deep Web信息检索模型。该模型包含4个层次,主要处理环节如任务分派、信息提取、数据清洗等引入了Deep Web特有的结构规则、逻辑规则和应用规则协助工作。把该模型应用于科技文献检索、电子机票定购和工作简历搜索3个领域,实验结果证明该模型灵活、可信,有效信息查全率达到96%以上。
- 杨巨峰史广顺赵玉娟王庆人
- 关键词:信息检索深层网络规则集数据提取
- 人工神经网络泛化问题研究综述被引量:25
- 2008年
- 从理论、方法(思想)和技术三个层次回顾了以往工作,讨论了模型复杂度、样本复杂度及两者之间关系的相关研究;在实际中,通过控制模型复杂度、调整样本等具体技术可以在一定程度上提高神经网络的泛化能力,但这些技术仍然存在一些问题没有解决。最后提出了对今后研究的展望。
- 王恺杨巨峰王立史广顺王庆人
- 关键词:人工神经网络泛化能力
- 语法结构分析指导下的数学公式图像版面分析方法被引量:1
- 2008年
- 简要回顾了数学公式结构分析的发展,指出数学公式结构分析针对各种数学公式的复杂结构,攫取出公式的版面结构和语义信息.因此,本文提出了一个在语法结构分析指导下的版面结构分析方法,给出了其系统架构,对系统中用到的版面结构分析方法进行了优化,并给出了最终实验结果.
- 胡静赵德新邢剑宽
- 关键词:文档图像分析