公共文化服务平台

物流信息系统架构分析被引量：2: 2015年; 针对当前GIS技术在物流信息系统中的应用现状进行了梳理,将当前的物流信息系统架构分为3类:基于C/S(client/server,客户机/服务器)模式的2层架构、基于B/S(browser/server,浏览器/服务器)的3层架构、基于GIS的4层架构。对各类系统架构的特征、共性问题(系统开发效率、系统的集成化)分别进行了梳理与归纳。通过解析可知,为了提高物流信息系统的效能,方案之一就是将物流信息理论和GIS理论进行深度结合,以弱化各类技术间的耦合性为突破口,研究基于GIS的新型物流信息系统架构。; 刘滨刘强张静远李寒; 关键词：GIS 物流物流信息系统系统架构

分布式数据挖掘综述被引量：10: 2014年; 随着网络技术、通信技术等的不断突破,互联网、移动网、广电网等多种类现代网络及其衍生业务迅速扩张,形成泛在于网络空间的分布式计算环境。为了最大化这些数据的价值,需要利用数据挖掘技术发现其中隐藏的模式或规则,用以指导和辅助生产或运营中的管理决策行为,以提高决策水平及决策收益。然而,受到普遍存在的异构性、私有性和平台兼容性等限制,兼因行业竞争和法律约束等因素(如个人或企业的数据隐私保护问题等),互联于网络的数据源难于进行集中式挖掘,分布式数据挖掘(DDM)技术应运而生。介绍了DDM的定义与框架、适用场景和研究挑战。根据文中给出的DDM高层架构,最终结果的质量与局部数据源的类型、可用性、局部结果的质量及整合方法等密切相关。DDM的实施未必都以站点间纯粹独立挖掘的方式进行,此外,对于数据集中,系统分布式站点多的情况,也可采用DDM。当前,DDM研究领域的挑战主要有:异构与同构挖掘、动态环境下的数据多变性、通信开销、知识整合和语义异构等。当前的DDM系统被分为4类:1)基于Multi-Agent的系统,利用Agent的自治性实现局部挖掘以保护数据私有性;利用Agent的主动性减少用户参与以提高挖掘自动化水平;利用Agent的协作性实现多算法协同挖掘等;2)基于网格的系统,利用网格在资源共享、开放服务和协同工作等方面的优势,提高挖掘的可靠性和协同性;3)基于元学习的系统,通过元学习优化挖掘算法的选择与组合,并对已获知识进行多次学习以提高结果质量;4)基于CDM(collective data mining)框架的系统,将待学习的函数表示为一组基函数的分布式存在,允许各数据源选择不同的学习算法,并以全局结果正确为前提减少网络通信量。进而,对当前DDM研究存在的共性问题进行了归纳:1)结果质量问题,不考虑各个站点数据源间的内; 刘滨; 关键词：分布式数据挖掘数据挖掘本体语义距离

信息可视化研究综述被引量：138: 2014年; 信息可视化是可视化技术在非空间数据领域的应用,可以增强数据呈现效果,让用户以直观交互的方式实现对数据的观察和浏览,从而发现数据中隐藏的特征、关系和模式。可视化应用非常广泛,主要涉及领域:数据挖掘可视化、网络数据可视化、社交可视化、交通可视化、文本可视化、生物医药可视化等等。根据CARD可视化模型可以将信息可视化的过程分为以下几个阶段:数据预处理;绘制;显示和交互。根据SHNEIDERMAN的分类,信息可视化的数据分为以下几类:一维数据、二维数据、三维数据、多维数据、时态数据、层次数据和网络数据。其中针对后4种数据的可视化是当前研究的热点。多维数据可视化方法主要包括基于几何的方法、图标方法和动画方法等。基于几何的可视化方式中最经典的就是"平行坐标系"方法。平行坐标系(parallel coordinates)使用平行的竖直轴线来代表维度,通过在轴上刻划多维数据的数值并用折线相连某一数据项在所有轴上的坐标点展示多维数据。平行坐标系方法能够简洁、快速地展示多维数据,发展出很多改进技术。但是当数据集的规模变得非常大时,密集的折线会引起"视觉混淆"(visual clutter),处理方法包括维度重排、交互方法、聚类、过滤、动画等。其他基于几何的方法包括Radviz方法使用圆形坐标系展示可视化结果;散点图矩阵(scatter plot matrix)将多维数据中的各个维度两两组合绘制成一系列的按规律排列的散点图。基于图标的可视化方法用具备可视特征的几何形状如大小、长度、形状、颜色等刻划数据,代表性的方法包括星绘法和Chernoff面法等。动画方法用于可视化中可被用来提高交互性和理解程度,其缺点包括可能分散注意力、引起用户的误解、产生"图表垃圾"等。时间序列数据是指具有时间属性的数据集,针对时间序列数据; 杨彦波刘滨祁明月; 关键词：信息可视化可视化技术人机交互数据挖掘

基于三元闭包和会员闭包的社区发现算法研究被引量：5: 2014年; 随着网络的发展和人们沟通方式的扩展,社交网络影响了人们的生活,改变了人们传播与分享消息的方式,吸引了越来越多的人关注和研究社交网络。社交网络即社交网络服务,源自英文SNS(social network service)的翻译,社交网络有多种表现平台,比如QQ、微博、Facebook和微信。本文主要研究微博这一新兴的社交平台,研究微博的主要目的是搞清用户之间的种种关系。当代人一般认为,微博中存在5种关系即关注关系、提及关系、转发关系、评论关系以及好友关系。由于社交网络中人数众多,关系错综复杂,因而产生的社交数据和传统的数据相比具有数据量大、结构复杂、语义丰富等特点,针对这种情况,依据用户之间的关系,提出了一种基于三元闭包的社区划分算法。该算法首先设初始社区为空,在所有的顶点中,选择度最大的顶点作为初始顶点;然后求初始顶点与其邻接顶点的三元闭包数和顶点属于该社区的概率PS,取它们最大的邻接顶点加入初始顶点所在社区,形成新的社区,继续迭代,当剩余的顶点很少时,可以使用会员闭包和三元闭包这种归集算法把剩余的顶点划分到不同的社区,直到把整个社区划分完毕;最后以图形这种直观、形象的方式把每一个社区表示出来。在该算法中,三元闭包数、顶点属于某社区的概率、扩张度的差是评估复杂网络中顶点划分的关键。该方法综合了顶点全局重要性的特点,即在复杂网络中,三元闭包数越大,它们处在一个社区的可能性就越大;顶点的会员闭包越大,该顶点就会越优先被划分;扩张度的差是确定第i个社区是否被划分完毕的关键。社交网络的研究不仅可以帮助人们了解网络结构、分析网络结构特性、探测分析网络的社团结构,而且还可以把虚拟世界中这种关系链接到现实世界中,即把虚拟关系转化成利润,为企业提供有价值的; 许云峰赵宁郝雪君李兵刘慧娟; 关键词：社交网络

基于时间序列分析的火电机组运行优化研究被引量：2: 2017年; 为了预测火电机组在变工况状态下的运行最优值,提高燃煤电厂的燃煤效率,依据燃煤火电厂3个月的各项数据,通过分析并挖掘燃煤火电厂与供电煤率密切相关的可调控参数(主蒸汽温度、主蒸汽压力)随时间的变化关系,利用Holt-Winters时间序列法进行预测。经过计算发现,通过Holt-Winters方法得到的主蒸汽温度和主蒸汽压力的相对误差值分别为0.28%和2.13%。实验结果表明:Holt-Winters时间序列法对预测燃煤火电厂火电机组在变工况下的运行数据是合理的,且其误差小,对燃煤火电厂提高火电机组的燃煤效率具有一定的指导意义。; 朱龙霞肖明美栗涛许云峰马瑞刘滨; 关键词：燃煤火电厂数据挖掘数据分析

基于数据驱动的司法公开信息化监管系统被引量：3: 2016年; 为了解决司法公开信息化监管的4个突出问题,站在数据驱动的角度,以形成价值数据为目标,将司法公开数据进行分类,进而给出数据处理的系统功能架构、技术架构和业务架构,涵盖数据采集、数据整理、数据分析、数据应用、数据安全等模块。以该架构为基础推进系统建设,能够有效降低司法公开信息监管的工作强度,分析工作状态,发现工作中的问题,促进司法公开水平的不断提高。; 李明刘滨; 关键词：计算机信息管理系统数据驱动司法公开数据挖掘

有向网络下的CoDA社区发现算法评估被引量：1: 2017年; CoDA算法是一种基于概率模型的能识别二分结构的社区发现算法。为了验证该算法的社区划分效果,采用信息检索领域的F-measure标准,对有向网络下重叠社区和非重叠社区的CoDA社区发现算法进行评估。F-measure标准中F1-measure值的大小能反映CoDA算法社区划分效果的优劣。实验所用的数据集由LFR Benchmark工具生成,数据集中节点数最小为100,最大为20 000,每增加100节点对CoDA算法社区划分效果评估一次。分析实验结果可以得出,当节点数小于1 600时,CoDA算法的划分效果较好。当节点数大于1 600时,随着节点个数增多,CoDA算法社区划分效果逐渐变差。由此说明,基于概率模型的CoDA算法适用于小规模社交网络社区的划分。; 郭松张冬雯许云峰杨玉林郑雅洁柳晨光; 关键词：有向网络 F-MEASURE

基于本体和语义距离的DBpedia领域知识抽取方法被引量：4: 2018年; 关联开放数据(LOD)中蕴藏着大量不同领域的知识,但是目前抽取其中特定领域知识的方法大多需要人工参与。为了能自动地抽取领域知识,提出根据领域本体抽取DBpedia中特定领域知识的方法。使用领域本体、Wikipedia和主题提取算法获得用于抽取领域知识的种子关键词集。在直接链接子图语义距离算法中,添加能够代表边指向性权值的参数,用于领域知识的抽取,并基于本体和字符串相似度比较的筛选策略对抽取的知识进行筛选。通过实验表明,该方法不仅能够获得较好的抽取效果,而且不需要人为地挑选关键词和参与筛选过程,极大地节省了时间和精力。; 张志申王会勇张晓明艾青孟明明; 关键词：领域本体知识抽取

微博分析研究综述被引量：11: 2015年; 微博,是当前重要的社会信息传播平台之一,具有易操作、传播快等特点,人们可以通过微博直接快速地表达对突发事件、公众人物、热门产品等的观点。为了利用海量微博信息,需要综合多种分析方法挖掘其潜在价值。综述了当前微博分析领域的研究现状,提出了自主研发的微博分析系统,探讨了未来微博分析的研究方向。首先,介绍了微博分析的主要技术方法,包括利用微博开放平台和利用网络爬虫技术。利用微博提供的开放接口,可以方便快捷地获取微博信息,如微博内容、用户评论、用户个人详情、粉丝数、关注数等。但也存在诸多限制,如每小时只能抓取有限次数、微博平台并不开放所有信息资源等。利用网络爬虫技术可以获取更多信息,如基于全网的网络爬虫的信息采集技术可以覆盖更广的范围,基于主题的网络爬虫的信息采集技术可以选择性爬取预先设定的主题等。其次,介绍了目前微博分析的热点问题,包括微博用户行为和微博内容两方面。微博用户行为分析包括:1)传播网络研究,利用Gephi等可视化工具,呈现出微博在传播过程中的传播路径、传播范围、关键转发节点等信息,可用于预测未来传播情况;2)传播因素研究,通过分析用户行为,揭示信息传播的可能原因;3)用户影响力分析,不同学者给出不同的度量方法,而要精准地评价用户影响力需要综合考虑多方面因素,如粉丝数、转发数、被提及数、回复、社会关系等。关于微博内容的分析包括:1)微博文本预处理,包括分词和去停用词2个步骤;2)微博热点话题发现,常用方法包括基于词频的统计方法和文本聚类方法,这两种方法都有利于提高发现热点话题的效果,但没有考虑到话题动态演变的特性;3)情感分析,也被称为观点挖掘,一直是微博研究领域的热点问题,可以利用微博表情图片抽取情感词,并结�; 刘滨张静远刘强赵静阳李寒徐巍巍; 关键词：数据库用户行为分析网络爬虫

基于大数据的图书馆文献合作关系挖掘方法研究: 2017年; 海量文献形成图书馆重要的数据资源,充分利用大数据分析工具,挖掘其中的潜在价值是当前的研究热点。采用大数据分析的方法,通过对海量文献数据的清洗、挖掘和可视化,研发出直观、易用的软件平台,并提供精准的文献检索工具,可以帮助读者快速发现重要作者和文献,有效提升图书馆数据资源的使用效率。; 刘宇刘滨; 关键词：大数据数据可视化

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

国家自然科学基金(71271076)

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

国家自然科学基金(71271076)

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈