苏贵洋
- 作品数:19 被引量:130H指数:6
- 供职机构:上海交通大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信文化科学语言文字更多>>
- 基于概念的自然语言处理
- 基于“概念”进行自然语言处理是近期的研究热点。本文在分析近几年概念的研究成果和经验基础上,从统计模型和概念词典两个方面对基于“概念”的自然语言处理进行了总结,并分析了现存的问题,以及未来研究的方向。作者提出对于“概念”的...
- 马颖华苏贵洋
- 关键词:自然语言处理
- 文献传递
- 基于字同现频率的主题抽取方法
- 一种基于字同现频率的主题抽取方法,属于信息处理领域。本发明以字为基本处理单元,首先对输入文本统计每个字出现的次数,删除出现次数只为一次的字和常用字,然后,通过统计全文中字的同现频率,并得到字与字之间同现所具有的信息量,将...
- 李建华李生红杨树堂苏贵洋马颖华陆松年
- 文献传递
- 一种基于内容的信息过滤改进模型被引量:29
- 2004年
- 根据过滤系统的不同过滤目的,将信息过滤分为两类:(1)基于满足用户信息需求的用户兴趣过滤;(2)基于保障数据安全和社会安全的安全过滤.在详细分析了这两类信息过滤的异同之后,指出了安全过滤研究的特殊性及其主要研究内容.在现有用户兴趣过滤系统模型的基础上,提出了一个基于内容的信息过滤模型,并对模型中新增模块进行了试验.研究结果表明,新增模块能够很好地实现基于内容过滤系统的高精度,证明了该过滤模型具有一定的实用价值.
- 苏贵洋马颖华李建华
- 关键词:信息过滤网络内容安全
- 信息自动获取的结构模型
- 本文介绍了一种全新的信息获取结构模型。该模型集成了信息检索以及信息过滤的技术和方法。在对用户手工获取网络信息的渠道和方法进行研究的基础上,从用户既往浏览历史中,抽取用户的兴趣特征。按照用户的既往兴趣进行信息的检索,主动下...
- 苏贵洋王永成马颖华
- 关键词:信息获取信息过滤
- 文献传递
- XML统一文本自动处理描述接口
- 使用尽可能多的特征准确的描述文本、尽可能选择有代表性的特征才能最大程度上改善文本处理系统的性能。如果文本特征处理程序(包括分词程序,词性、语法标注程序,主题分析、结构分析程序)都以一种统一的规范来输出其处理结果,这样,其...
- 苏贵洋李建华马颖华
- 关键词:文本特征元数据文本标注XML
- 文献传递
- 信息基地的构架和建设模型被引量:6
- 2003年
- 用户在过载的Internet信息检索中,往往不能查询到自己希望获得的内容.为此,本文提出了信息基地的概念,它是对特定领域内因特网信息资源进行"精"加工处理和长期保存的"小型数字图书馆",将在特定领域内最大限度的便利用户的检索需求.本文对信息基地的构架和建设中涉及的关键技术进行了初步的剖析,还介绍了上海交通大学OA实验室正在建设中的"中文信息处理信息基地"系统流程.
- 苏贵洋王永成马颖华
- 关键词:网络信息检索信息过载中文信息处理信息存储
- 新闻XML标准的比较与研究被引量:11
- 2003年
- 列举当前的主要几种新闻XML标准,进行比较和分析。
- 戴怡钧王永成苏贵洋
- 关键词:NEWSMLPRISMRSSICE新闻标准
- 用于中文色情文本过滤的近邻法构造算法被引量:10
- 2004年
- 从不良信息中最为普及的中文色情文本过滤入手,用近邻法(KNN)算法构造对比了4种特征项选择的方法在中文色情文本中的应用,它们分别是字、词、标点符号和词性等特征.试验表明,中文色情文本不同特征项的选择对中文色情文本的分类效果起到了重要的作用.实验同时表明,所设计的过滤器在保证速度的前提下,很好地完成了基于内容的高精度过滤.
- 苏贵洋李建华马颖华李生红
- 关键词:文本过滤信息过滤文本表示向量空间模型
- 文本集合可视化系统
- 一种计算机应用技术领域的文本集合可视化系统,包括:文本采集模块、中文分词模块、词语权重计算模块、XML文件组织模块、可视化图形界面模块,先通过文本采集模块、中文分词模块、特征词权重计算模块和XML文件组织模块构成本地数据...
- 马颖华苏贵洋李建华冯薇李文婷
- 文献传递
- 基于客流预测和自适应仿真的拥挤预警系统
- 一种计算机仿真技术领域的基于客流预测和自适应仿真的拥挤预警系统,包括:现场建模模块、测量模块、数据存取模块、客流预测模块、客流自适应仿真模块、拥挤预警模块、实施拥挤预案模块,现场建模块通过对现场进行建模,测量模块对现场人...
- 马颖华苏贵洋王明政李建华谭大礼张志远何业
- 文献传递