汪卫
- 作品数:229 被引量:733H指数:14
- 供职机构:复旦大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学理学电子电信更多>>
- 一种新的XML文档编码机制被引量:21
- 2004年
- XML查询中正则路径表达式的实现 ,需要快速判断元素间父子关系或祖先 -后代关系 目前 ,基于树遍历的XML文档编码是一种主流的方法 ,但父子关系的判断需要在编码之外附加辅助的措施 ,部分实现不支持文档更新 提出一种新的编码方法 ,能够在常数复杂度的时间内实现两个元素间父子关系、祖先-后代关系的判断 ,计算祖先-后代结点间的辈数差异 。
- 路燕张亮汪卫张彪施伯乐
- 关键词:XMLXML查询正则路径表达式
- ECMail:基于实体发现、查找和管理的中文邮件管理系统
- 随着个人用户的数据和信息级数增长,个人信息管理的研究成为热点.电子邮件作为个人信息的重要载体在个人信息业务中占据着重要的地位.随着个人信息的增加,用户在对邮件进行查询时经常遇到遗忘关键字的困扰,对此普通的邮件工具很难为用...
- 文捷汪卫王轶彤
- 关键词:电子邮件中文分词
- 文献传递
- 预测模型的构建方法和数据预测方法
- 本发明涉及数据预测模型的构建方法,用于客户端,包括:使用反向传播训练得到数据预测模型,其中,数据预测模型包括参数识别模块和机理模型;参数识别模块基于低级已知数据和/或高级已知数据,确定机理模型的可变参数的值;机理模型基于...
- 王鹏李姜辛张翰博汪卫
- AdaBoost算法的一种改进方法被引量:18
- 2004年
- Boosting是一种改善任意给定的机器学习算法准确性的通用方法 .主要针对 Ada Boost算法 ,介绍了 Ad-a Boost算法的研究背景 .分析了实验过程中出现的退化问题以及目标类权重分布扭曲的现象 ,提出了一种基于调整权重分布 ,限制权重扩张的改进方法 。
- 李斌王紫石汪卫施伯乐
- 关键词:ADABOOST
- 一种多级安全数据模型中的多实例语义
- 为了对低安全级的主体(用户)隐藏高安全级的敏感信息,在多级安全数据模型中引入了多实例的概念.关于多实例的语义以及维护一直是多级安全数据模型的研究热点.提出了一种新的多实例语义MLS-POS,并给出了该语义下维护多实例的方...
- 唐莞菁汪卫王智慧周皓峰施伯乐
- 关键词:语义多实例
- 文献传递
- XML的并发加锁协议被引量:8
- 2004年
- 随着XML数据库管理系统 (XMLDBMS)研究的日益深入 ,研究基于树型结构的XML数据的并发控制协议变得十分重要 由Silberschatz和Kedem提出的树加锁协议 (treeprotocol)是基于静态树结构数据而定义的 而XML数据是动态变化的树型结构数据 针对XML数据的特点 ,定义了一个操作集 ,它可以将一个树型结构的XML文档变化为另外一个合法的树型结构的XML文档 该操作集的最大特点是其操作对象为一棵子树而非一个结点 在这个操作集基础上定义了XML动态树协议XDTP(XMLdynamictreeprotocol) ,并证明了该协议能继续保持静态树协议的优良特性 :可串行化 (serializability)和无死锁 (deadlock freedom) 在实际的数据集上进行了实验 。
- 庞引明谈子敬汪卫
- 关键词:XML并发操作
- 基于图表示学习的领域知识图谱推理技术研究被引量:1
- 2023年
- 现有领域知识图谱推理模型多数是由基于百科类通用知识图谱的推理模型迁移而来,但是领域知识图谱的异构性并未得到妥善处理。同时,现有研究将关系预测与三元组分类视作2个独立的任务而忽视了两者之间的关联,且领域知识在领域模型的建立过程中也未得到充分的利用。针对上述问题,建立基于翻译距离的改进推理模型TransSep,为异构的实体类型分配不同的特征空间。提出一种联合训练的策略,使得关系预测与三元组分类2个任务互相指导对方的负采样过程,并交替地学习实体的嵌入特征,从而提升2个任务的训练效果。以医疗领域知识图谱为例,将领域知识通过元路径的思想引入TransSep模型中,增强模型的表达能力。在由复旦大学构建的精准医学知识图谱上进行实验,结果表明,相比TransE、DistMult、TriModel等模型,TransSep模型在关系预测任务中MR分数至少提高17.4%,三元组分类任务中的F1值提高至0.9286。
- 隋国华李陶然刘昊陈林汪卫
- 关键词:知识推理
- XML数据模式下基于purpose的隐私访问控制策略研究与实现被引量:3
- 2013年
- 提出构建基于purpose的对XML数据模式的隐私访问控制策略模型,解决由路径传递引起的查询隐私数据泄漏问题。基于purpose的隐私访问控制策略是一棵最小安全访问树模型。最小安全访问树是一组无冗余路径的以XPath{/,//,[]}片段表示的路径表达式,XPath{/,//,[]}是一组允许访问的隐私结点路径。实验表明最小安全树生成时间取决于隐私结点在一个XML文档中的标注时间和冗余路径的判别时间,而隐私结点的标注时间与隐私数据在XML文档中的分布位置有关。最小安全访问树模型能控制隐私数据的查询泄漏。
- 刘逸敏王智慧汪卫
- 关键词:隐私保护访问控制
- CuMen:基于最大频繁序列模式的聚类算法及其在基因拼接中的应用
- 基因组序列拼接的主流方法将整条序列随机打断成小片段,然后根据片段间重叠关系连接成长序列。由于较多噪音存在,算法复杂度高,加之生物数据的海量增长,序列拼接处理导致巨大的时空开销而无法完成。本文提出一种基于最大频繁序列模式的...
- 黄东唐俊汪卫施伯乐
- 关键词:序列聚类网格
- 文献传递
- 半结构化查询重写的MiniCon算法被引量:9
- 2004年
- 研究了基于半结构化数据查询语言TSL(tree specification language)的查询重写问题.提出了一种半结构化查询重写算法,解决了在给定一个半结构化查询和一组半结构化视图的情况下,找到最大被包含重写的问题.算法借用了可伸缩的关系查询重写的MiniCon算法的思想,解决了半结构化数据模型之下查询重写的一些新问题(如标识符依赖、集合值变量映射等).证明了算法的正确性.
- 陶春汪卫施伯乐
- 关键词:查询重写EXCHANGE半结构化数据