搜索到840 篇“ 去重算法 “的相关文章
基于去 重 算法 的高性能数据风险影响面量化评估方法 本发明公开了基于去 重 算法 的高性能数据风险影响面量化评估方法,具体涉及数据安全领域,包括数据预处理模块、数据缓存模块、数据风险模块、数据价值模块和数据更新模块。本发明通过基于loglogcounting、linear co... 张腾伟 周顿科网络内容的去 重 算法 与语义量化研究 2024年 为降低网站对用户的影响,同时提升去 除重 复的能力,设计了一种能够应用在大型网站的去 除重 复的创新方案。首先,利用文本预处理技术提取网页正文内容关键词和长句特征码;其次,使用Simhash算法 把特征码映射成指纹,并构建关键词指向文档的倒排索引;最后,通过关键词快速找到与待测文档高度相似的文档,接着只需比较待测文档与相似文档的指纹,即可判断网页是否重 复。结果显示,该算法 识别率较高,实用性良好。 谢志豪 杨贤关键词:网页去重 特征指纹 长句 混合云网络加密数据自动去 重 算法 优化仿真 2024年 为保证网络用户的加密数据安全性、减少云环境条件下的存储开销,提出一种混合云环境下网络加密数据去 重 算法 优化算法 。分析和评估云环境中的威胁,建立数据加密相关条件,通过多项式加强网络用户加密数据的隐私性。设立机密信息求解的多个必要前提条件,避免其它网络用户通过不合法手段获取数据信息。初始化加密数据去 重 的相关参数,确保数据的双线性映射,利用哈希函数确定数据基本特性,区分数据流行度,对不同流行度的数据设定不同的去 重 阈值条件,实现网络用户加密数据去 重 算法 设计和优化。经实验证明,所提算法 占用的网络空间较小,具备良好的加密去 重 性能,网络传输量较低。 施建 王帅关键词:加密数据 去重算法 双线性映射 云存储抗边信道攻击的密文数据去 重 算法 2024年 考虑云储存中密文数据相似性较高,导致去 重 难度过大的问题,提出一种基于执行机构的密文数据去 重 算法 。构建密文动态平衡跳跃表,根据对动态平衡跳跃表的构建与描述,得到抗边信道攻击的密文数据动态叠加特点。基于密文动态平衡跳跃表构建与更新结果,提出一种抗边信道攻击的数据去 重 框架,云储存提供商执行数据加密、数据标签查询以及数据去 重 三个过程。云端储存使用标签代表数据查询操作,一旦查询计数超过阈值,执行数据加密程序对该文件进行加密,并按照云储存服务商提供的执行命令对重 叠密文进行去 重 。实验结果证明,所提方法对密文数据去 重 效果表现较佳,去 重 后云储存空间占用情况得到了明显改善。 吴玲红 王葵 刘捷面向可视分析的比特币交易地址去 重 算法 研究 2024年 比特币是一种基于区块链的加密货币,其因具备匿名性而常被用于异常交易活动中,使得交易者的行为不容易被分析出来。因此,通过有针对性的数据可视化方法对数据进行呈现,以便于对某些实体的活动保持更加全面的了解仍然是一项挑战。作者提出了一种比特币地址去 重 算法 ,解决了比特币交易过程中出现的地址复用现象所产生的环状数据结构问题。该方法按照时序性计算了交易发起方和接收方地址节点的出现次数并记录节点状态,每当发现重 复使用的地址便会更新当前地址节点状态,并用此最新状态进行覆盖,从而保证处理后的交易数据中不存在地址重 复使用的问题,降低了数据可视化的难度。然后使用桑基图这一数据可视化方法结合处理后的数据有效地展示了一些交易行为并对其进行分析。实验证明了文中方法的可行性和准确性。 刘志磊 王劲松 赵泽宁关键词:数据可视化 数据分析 基于事件异构图表示的文本去 重 算法 被引量:4 2023年 基于图结构的文本表示方法在新闻文本去 重 中具有更好的效果.但是,目前该表示方法还不能完整地表示文本的全部信息,并且忽略了图的语义信息,降低了新闻文本的去 重 效果.为此,本研究提出基于事件异构图表示的文本去 重 算法 ,该算法 首先通过事件异构图表示新闻文本的全局语义与结构信息,然后提出双标签图核算法 表征事件异构图,实现深度表征图的结构及语义信息.实验结果表明,该研究提出的去 重 算法 比现有的基于图结构的文本表示去 重 方法在F1-score指标上提升了10%.最后,该算法 能提高新闻文本的去 重 效果. 艾玮 许佳 谢灿豪 孟涛关键词:新闻文本 文本表示 基于关键词图表示的文本语义去 重 算法 2023年 网络中存在大量语义相同或者相似的冗余文本,而文本去 重 能够解决冗余文本浪费存储空间的问题,并能为信息抽取任务减少不必要的消耗。传统的文本去 重 算法 依赖文字重 合度信息,而没有较好地利用文本语义信息,同时也无法捕捉长文本中距离较远句子之间的交互信息,去 重 效果不理想。针对文本语义去 重 问题,提出一种基于关键词图表示的长文本去 重 算法 。首先,通过抽取文本对中的语义关键词短语,将文本对表示为以关键词短语为节点的图;其次,通过多种方式对节点进行编码,并利用图注意力网络(GAT)学习节点之间的关系,从而得到文本对图的向量表示,并判断文本对是否语义相似;最后,根据文本对的语义相似度进行去 重 处理。与传统算法 相比,所提算法 能有效利用文本的语义信息,并能通过图结构将长文本中距离较远的句子用关键词短语的共现关系连接起来,从而增加不同句子之间的语义交互。实验结果表明,所提算法 在两个公开数据集CNSE(Chinese News Same Event)和CNSS(Chinese News Same Story)上都取得了比Simhash、BERT(Bidirectional Encoder Representations from Transformers)微调、概念交互图(CIG)等传统算法 更好的表现。具体地,所提算法 在CNSE数据集上的F1值达到84.65%,在CNSS数据集上的F1值达到90.76%,说明所提算法 可以有效提升文本去 重 任务的效果。 汪锦云 向阳关键词:关键词抽取 文本匹配 图表示 一种基于局部敏感哈希的文本数据去 重 算法 及其实现 被引量:2 2023年 预训练语言模型的发展激发对网络数据的大规模需求,而网络数据往往具有较高的重 复性和相似性,需要经过去 重 才能更好地被用于模型训练.目前的去 重 算法 可以去 除相似和相同的文本数据,但存在运算效率较低的问题,难以用于处理大规模文本数据.本研究提出一种面向大规模文本数据的去 重 算法 ,采用先局部后整体的去 重 策略,极大提高了去 重 的运算效率.实验结果表明,算法 在50 h内完成371 GB数据的去 重 处理,较已有算法 极大地提高了去 重 效率. 申峻宇 李东闻 钟震宇 张玉志基于小波域的数字化媒体图像自适应模糊去 重 算法 被引量:1 2023年 针对目前图像的模糊去 重 方法存在处理后图像不清晰、质量不高的问题,提出了基于小波域的数字化媒体图像自适应模糊去 重 算法 。首先通过小波域方法对数字化媒体图像完成去 噪处理;其次利用逐步标注显著区域方法将数字化媒体图像分成保护与非保护区域,其中保护区域即为显著区域;最后利用显著性正则化处理图像,完成图像的自适应模糊去 重 算法 。实验结果表明,基于小波域的数字化媒体图像自适应模糊去 重 算法 处理后的图像噪声低、质量高、图像信息丰富,清晰度好。 刘家齐关键词:小波域 去噪处理 图像分块 混合云环境下多维数据安全去 重 算法 研究 被引量:2 2023年 多维数据重 复率过高,即多维数据冗余杂乱,会导致目标数据检索困难,数据计算复杂度提升,为了降低多维数据冗余度,提高目标数据检索效率,提出混合云环境下多维数据安全去 重 算法 。利用小波变换和高白光干涉信号对原始多维数据去 噪,根据局部非参数建模方法提取去 噪后的多维数据特征;运用Simhash算法 和聚类算法 ,获取多维数据特征的可识别镜像分段聚类结果;利用DBSCAN算法 分割以相同镜像分段为单位的同组多维数据,实现整体多维数据的安全去 重 。仿真结果表明,所提方法计算时间开销少、去 重 率高。 杨丽华 鄂晶晶 冯锋关键词:多维数据 小波变换 聚类算法
相关作者
吴朋朋 作品数:5 被引量:0 H指数:0 供职机构:北京邮电大学 研究主题:移动终端 去重 通讯录 去重算法 数据同步 黄玮 作品数:51 被引量:30 H指数:3 供职机构:中国传媒大学 研究主题:漏洞 恶意 设置方式 靶场 情报 申文明 作品数:7 被引量:11 H指数:2 供职机构:广西大学 研究主题:翻译 越人 音译 去重 平行语料库 牙漫 作品数:3 被引量:27 H指数:2 供职机构:重庆大学计算机学院 研究主题:基于网页 去重算法 WEB挖掘 网页去噪 网页结构 刘连芳 作品数:13 被引量:59 H指数:4 供职机构:广西大学计算机与电子信息学院 研究主题:OSG 去重 全景图拼接 全景图 图像融合