桂伟
- 作品数:3 被引量:15H指数:2
- 供职机构:安徽工业大学管理科学与工程学院更多>>
- 发文基金:国家自然科学基金安徽省高校省级自然科学研究项目安徽省自然科学研究项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 混合式学习在本科教学中的应用被引量:2
- 2016年
- 信息技术的高速发展,为混合式学习提供了基础。混合式学习包含多种差异类型的学习方式以及各类教学模式的融合。教师应充分利用网络资源,将传统的课堂教学方式同在线网络学习方式结合起来,充分发挥教师作为监督者的作用,调动学生的自主学习积极性,以提高教学质量。
- 邢国正江雨燕桂伟
- 关键词:网络教学资源教学设计
- 基于Spark的并行FP-Growth算法优化与实现被引量:8
- 2017年
- 频繁模式挖掘作为模式识别的重要问题,一直受到研究者的广泛关注。FP-Growth算法因其高效快速的特点,被大量应用于频繁模式的挖掘任务中。然而,该算法依赖于内存运行的特性,使其难以适应大规模数据计算。针对上述问题,围绕大规模数据集下频繁模式挖掘展开研究,基于Spark框架,通过对支持度计数和分组过程的优化改进了FP-Growth算法,并实现了算法的分布式计算和计算资源的动态分配。运算过程中产生的中间结果均保存在内存中,因此有效减少数据的I/O消耗,提高算法的运行效率。实验结果表明,经优化后的算法在面向大规模数据时要优于传统的FP-Growth算法。
- 陆可桂伟江雨燕杜萍萍
- 关键词:频繁模式挖掘FP-GROWTH算法分布式计算
- 基于受限玻尔兹曼机的分布式主题特征提取被引量:5
- 2017年
- 随着大数据时代的来临,如何有效从海量的文本数据中挖掘和分析主题特征已成为学者们的研究重点。隐含狄利克雷分配(Latent Dirichlet Allocation,LDA)作为经典的概率主题模型,因其自身优越的文本分析能力被广泛应用。然而,该模型大多以包含隐含主题变量的有向图的形式存在,实现文档的表达具有局限性。而分布式表示方法定义文档的语义分布在多个主题中并由多主题特征相乘得到;且由于传统的无监督特征提取模型无法有效处理含类别标记的文档数据,故在研究受限玻尔兹曼机(Restricted Bolzmann Machine,RBM)的基础上,结合文本主题的分布式特性,提出了基于RBM的分布式主题特征提取模型NRBM,其自身作为典型的半监督模型能够有效利用文档中的多标记信息。最终与标准LDA主题模型的对比实验证明了NRBM模型的优越性。
- 江雨燕桂伟
- 关键词:文本数据