您的位置: 专家智库 > >

李文波

作品数:36 被引量:244H指数:7
供职机构:中国科学院软件研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划北京市财政局项目更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 14篇期刊文章
  • 12篇专利
  • 9篇会议论文
  • 1篇学位论文

领域

  • 26篇自动化与计算...
  • 1篇文化科学

主题

  • 10篇中文
  • 8篇信息处理
  • 8篇中文信息
  • 8篇中文信息处理
  • 6篇计算机
  • 5篇查询
  • 4篇单字
  • 4篇语言处理
  • 4篇数据处理
  • 4篇自然语言
  • 4篇自然语言处理
  • 4篇网络
  • 4篇计算机应用
  • 4篇LDA模型
  • 3篇信息检索
  • 3篇搜索
  • 3篇随机场
  • 3篇条件随机场
  • 3篇中文命名实体
  • 3篇中文命名实体...

机构

  • 36篇中国科学院软...
  • 3篇北京市科学技...
  • 3篇河南工学院
  • 2篇中国科学院研...
  • 1篇中国科学院大...

作者

  • 36篇李文波
  • 26篇孙乐
  • 6篇冯元勇
  • 6篇张大鲲
  • 3篇吴健
  • 3篇王俞霖
  • 3篇吴素研
  • 2篇丁治明
  • 2篇张顺昌
  • 2篇诺明花
  • 2篇黄瑞红
  • 2篇许佳捷
  • 1篇孙玉芳
  • 1篇吕志坚
  • 1篇曹晖
  • 1篇程伟
  • 1篇董静
  • 1篇张玮
  • 1篇张永臣
  • 1篇李明树

传媒

  • 6篇中文信息学报
  • 2篇现代情报
  • 2篇计算机系统应...
  • 1篇天津科技
  • 1篇通信学报
  • 1篇电子学报
  • 1篇计算机学报
  • 1篇2007年全...
  • 1篇第五届全国信...
  • 1篇第一届全国信...
  • 1篇第五届全国信...
  • 1篇NCIRCS...

年份

  • 1篇2023
  • 1篇2020
  • 2篇2018
  • 3篇2017
  • 1篇2016
  • 1篇2014
  • 1篇2013
  • 2篇2011
  • 4篇2010
  • 5篇2009
  • 6篇2008
  • 5篇2007
  • 1篇2006
  • 3篇2004
36 条 记 录,以下是 1-10
排序方式:
基于Labeled-LDA模型的文本分类新算法被引量:110
2008年
LDA(Latent Dirichlet Allocation)模型是近年来提出的一种能够提取文本隐含主题的非监督学习模型.通过在传统LDA模型中融入文本类别信息,文中提出了一种附加类别标签的LDA模型(Labeled-LDA).基于该模型可以在各类别上协同计算隐含主题的分配量,从而克服了传统LDA模型用于分类时强制分配隐含主题的缺陷.与传统LDA模型的实验对比表明:基于Labeled-LDA模型的文本分类新算法可以有效改进文本分类的性能,在复旦大学中文语料库上micro-F1提高约5.7%,在英文语料库20newsgroup的comp子集上micro-F1提高约3%.
李文波孙乐张大鲲
关键词:文本分类图模型
基于特征空间分解的文本大数据主题挖掘方法和装置
本发明涉及一种基于特征空间分解的文本大数据主题挖掘方法和装置。该方法主要包含两个关联的部分:一是基于主题特征的空间分解方法;二是基于多子空间的模型求解并行加速方法。空间分解方法的关键在于利用模型特征对数据样本和主题集合进...
李文波孙乐
文献传递
一种音字转换方法
本发明公开了一种音字转换方法,属于中文信息处理技术领域。本发明方法包括:切分输入的拼音串,利用词树层将音节转化成汉字,同时调用歧义处理模块对切分后的音节进行歧义判定,若存在歧义,则重新切分;所述歧义包括I型歧义和/或II...
张顺昌孙乐李文波
文献传递
基于语义蕴含关系的图片语句匹配模型
2017年
本文提出一种基于蕴含关系的图片语句匹配模型IRMatch,旨在解决图片语句两种不同模态语义之间的非对等匹配问题.在利用卷积神经网络分别对图片和语句进行语义映射的基础上,IRMatch模型通过引入最大软间隔的学习策略挖掘图片与语句之间的蕴含关系,以强化相关图片语句对在公共语义空间中位置的邻近性,改善图片语句匹配得分的合理性.基于IRMatch模型,本文实现一种图文双向检索方法,并在Flickr8k、Flickr30k以及Microsoft COCO数据集上与基于已有图片语句匹配模型的图文双向检索方法进行了比较.实验结果表明,基于IRMatch模型的检索方法在上述三个数据集上的R@1,R@5,R@10以及Med r均优于基于已有模型的检索方法.
柯川李文波汪美玲李孜
关键词:卷积神经网络
一种基于隐含狄利克雷分配模型的并行数据处理方法
本发明公开了一种基于隐含狄利克雷分配模型的并行数据处理方法,属于数据挖掘领域,该方法包含了多进程并行处理、多线程并行处理和复合多进程多线程处理三种方案,在这三种方案中都将要处理的数据D<Sub>M</Sub>分成长度为等...
李文波孙乐
文献传递
基于分类信心重排序的中文共指消解研究被引量:2
2007年
共指消解是自然语言处理的核心问题之一。本文针对分步消解中分类器全局信息的不足,依据分类信心对全体提及配对进行排序,优先根据可靠的分类结果对提及进行聚集或分离。实验表明,该算法在多个学习框架下显著地改善了系统的整体性能。
冯元勇孙乐董静李文波
关键词:计算机应用中文信息处理信息抽取自然语言处理聚类算法
基于黄变换的通用隐写分析方法研究
本文提出将适合对非线性、非平稳信号进行时频分析的Hilbert-Huang变换方法应用到图像的通用盲隐写分析中,并选择适合图像分析的特征抽取的方法和构造了适合图像盲检测的核函数提高分类器的性能,达到通用盲隐写的有效检测。
吴素研李文波王强
关键词:盲检测
文献传递
科技情报大数据业务平台设计被引量:14
2018年
[目的 /意义]本文分析了目前大数据时代科技情报工作面临的问题和机遇,针对情报服务领域大数据服务模式进行了分析。[方法/过程]该论文结合信息技术领域的虚拟化技术、云平台技术、高性能技术和人工智能技术,设计了科技情报大数据业务平台架构,详细阐述了硬件层、虚拟层、支撑层和业务层主要功能和所需技术;并对大数据处理首要任务存储进行了探索,搭建了基于hadoop和hbase的大数据存储平台。[结果/结论]本文提出的大数据情报业务平台从整体架构进行了设计,并实现了存储模块,下一步实现分析和可视化部门,可以为情报的收集和处理提供大数据支撑服务。
吴素研吕志坚吴江瑞李文波
关键词:科技情报大数据HADOOPHBASE
一种符合ISO14651语义的藏文排序实现方法被引量:23
2004年
本文介绍了一种实现藏文字典序排序的方法 ,它针对藏文“大字丁字符集”编码方案。通过引入有(无 )前加基字符的概念 ,它把待排序的藏字预处理为有 (无 )前加基字符、前加字符、基字 (基字符或者字丁 )、后加字符、再后加字符串后 ,再行比较 ,从而避免拆分字丁。本实现方法符合ISO/IEC14 6 5
林河水程伟曹晖李文波吴健孙玉芳
关键词:计算机应用中文信息处理藏文字典序
一种音字转换方法
本发明公开了一种音字转换方法,属于中文信息处理技术领域。本发明方法包括:切分输入的拼音串,利用词树层将音节转化成汉字,同时调用歧义处理模块对切分后的音节进行歧义判定,若存在歧义,则重新切分;所述歧义包括I型歧义和/或II...
张顺昌孙乐李文波
文献传递
共4页<1234>
聚类工具0