徐玉生
- 作品数:8 被引量:88H指数:3
- 供职机构:兰州大学信息科学与工程学院更多>>
- 发文基金:广东省教育部产学研结合项目更多>>
- 相关领域:自动化与计算机技术电气工程更多>>
- 数据挖掘中数据预处理技术综述被引量:80
- 2003年
- 数据挖掘是数据库系统和信息决策领域的前沿研究方向.论述了数据预处理在数据挖掘中的重要地位,介绍了数据预处理所包含的内容和采用的方法.
- 刘莉徐玉生马志新
- 关键词:数据挖掘数据预处理数据清理数据集成数据归约数据库系统
- 软件网络实验室模型研究
- 随着网络技术的发展和业务分布式处理的要求,计算机网络已经遍布全球,伴随着'企业上网'、'政府上网'及'三金'工程的启动,中国的网络应用已经向纵深方向发展.网络的应用普及,也必然需要大量的网络应用性人才来规划、设计、运行、...
- 徐玉生
- 关键词:网络实验室UML动态视图网络流量分析
- 文献传递
- 基于信息提取的面向行业应用文本分类算法
- 目前,传统文本分类算法都是脱离自然语言语意的.该文使用信息抽取进行了中文文本分类的研究,提出了补偿式信息抽取的主题文本分类算法(CIETC),通过分类补偿文档属性,达到行业文档分类的目的.实验中,以将关于一个人名的所有网...
- 郭峰徐玉生陈晓云王颖
- 关键词:文本分类信息提取面向主题自然语言理解
- 文献传递
- 一种基于ESEquivPS的封闭频繁项集挖掘算法
- 2009年
- 本文提出一种基于ESEquivPS(扩展支持度相等性剪枝策略)的封闭频繁项集挖掘算法ECFIMA。该算法采用深度优先和广度优先相结合的策略访问搜索空间,使用垂直位图向量格式存储表示项集和事务数据库,同时利用基本剪枝策略、相等性剪枝策略、扩展支持度相等性剪枝策略1和扩展支持度相等性剪枝策略2进行候选空间剪枝,并采用多种不同特性的测试数据集进行实验。实验结果表明,ECFIMA算法是一种高效的封闭频繁项集挖掘算法,在多种测试数据集上性能都优于CHARM算法,尤其是在拥有大量长的封闭频繁项集的测试数据集上,效率比CHARM算法提高约2~3倍。
- 白承森马志新徐玉生
- 关键词:数据挖掘剪枝策略搜索空间
- 频繁模式挖掘算法与剪枝策略研究
- 频繁模式挖掘是一类基本的数据挖掘问题,可以广泛应用于关联规则分析、相关性分析、孤立点分析、分类和聚类等多种数据挖掘任务,是一个具有重要理论意义和广阔应用前景的课题。本文对频繁模式挖掘问题进行了深入研究和探索,主要内容如下...
- 徐玉生
- 关键词:频繁模式挖掘剪枝策略关联规则格理论
- 文献传递
- 基于信息提取的面向行业应用文本分类算法被引量:4
- 2005年
- 目前,传统文本分类算法都是脱离自然语言语意的。该文使用信息抽取进行了中文文本分类的研究,提出了补偿式信息抽取的主题文本分类算法(C IETC),通过分类补偿文档属性,达到行业文档分类的目的。实验中,以将关于一个人名的所有网络文档自动分类为例,验证了这种面向行业的C IETC分类器的分类性能。结果表明:该方法的分类准确率要优于B ayes方法,与KNN方法相当;该方法是一种可行的面向行业细分文本分类方法。
- 郭峰徐玉生陈晓云王颖
- 关键词:文本分类信息提取面向主题自然语言理解
- 动态多连接池实现高效地数据库访问
- 2010年
- 连接池技术是实现高效数据库访问的一种重要手段,本文在分析现有连接池技术的基础上,提出了一种真正的动态、多连接池的实现方案。该方案通过多连接池的不同配置,实现严格的访问权限控制;多连接池采取统一管理,发生请求碰撞时,分别在不同的连接池挂起等待,实现多用户并行连接池访问;依据连接池运行的历史数据,作为进一步连接池配置的参数,从而实现连接池配置管理动态化、自动化。在实现动态多连接池管理的同时,也加强了数据库访问的安全控制,同时还实现了异构数据库管理系统(DBMS)的统一访问。实验结果表明,该方案可以有效地的提高数据库访问效率,同时实现数据库的细粒度访问控制。
- 安红心徐玉生
- 关键词:连接池数据库安全细粒度访问控制