彭雅
- 作品数:6 被引量:77H指数:4
- 供职机构:湖南大学更多>>
- 发文基金:国家自然科学基金湖南省自然科学基金教育部科学技术研究重点项目更多>>
- 相关领域:自动化与计算机技术政治法律更多>>
- 基于认知学习的最小风险贝叶斯邮件过滤算法被引量:17
- 2004年
- 提出了超高维向量空间中的一种新的邮件向量表示方法,在考虑邮件误判风险的基础上,给出了一种基于认知学习模式的邮件过滤新算法。该算法模拟人类的认知学习过程,将系统分类与用户识别有效地结合起来,使得邮件过滤时的误判风险最小化。实验结果表明,算法具有较好的学习能力和学习效果,在邮件过滤应用中,能获得较高的查全率和查准率。
- 王雷林亚平彭雅李闻
- 关键词:朴素贝叶斯邮件过滤
- 基于最小类差异的无关信息预处理算法被引量:14
- 2003年
- 为了降低无关信息对文本分类精度的影响 ,提出了基于最小类差异的预处理算法 .算法通过分析文本特征在类中的分布情况 ,将特征划分为三种类型 ,按照特征在各类间的分布差异 ,保留对分类有作用的单类特征与多类特征 ,而将类分布差异较小的一般特征进行过滤 .实验结果表明 ,采用新算法进行分类预处理所得到的分类精度明显优于信息增益、互信息量等预处理算法 .
- 陈治平林亚平彭雅王雷童调生
- 关键词:信息增益互信息量朴素贝叶斯
- 论我国私募基金法律制度的构建
- 私募基金是不经严格的注册核准程序、以非公开方式向少数机构投资者和有实力的个人投资者募集资金而设立的投资基金。与公募基金相比,私募基金在运作方式、信息披露、设立成本方面有着独特的优势,但是也存在着一定的缺陷。
关...
- 彭雅
- 关键词:私募基金法律制度
- 文献传递
- 几种常用文本分类算法性能比较与分析被引量:34
- 2007年
- 分析了几种典型的文本分类算法的特点,并基于中文文本数据集和英文文本数据集对算法性能进行了综合评价.实验结果表明:对于英文文本数据,支持向量机具有最优的性能,但时间开销最大,贝叶斯算法速度较快;对于中文文本数据,由于分词的困难,使得算法性能普遍低于同等规模下在英文数据集上的性能.几种算法性能均随训练集规模的增大而有改善.
- 卢苇彭雅
- 关键词:文本分类支持向量机K近邻贝叶斯算法TFIDF算法
- 文本分类算法及其应用研究
- Internet技术的迅速发展导致网站上的文档信息成指数级增长,因此如何自动处理这些海量文档信息成为目前重要的研究课题.信息分类是文档信息处理中的一个重要环节.信息分类主要是将从网上抽取到的文档信息自动有效地分成一定的类...
- 彭雅
- 关键词:信息分类文本分类超文本分类
- 文献传递
- TFIDF_-NB协同训练算法被引量:4
- 2004年
- 采用少量已标记和大量未标记文档进行文本分类已成为一种重要研究趋势 .在分析了 EM和联合训练 (Co-training)两类算法的基础上 ,提出一种新的协同训练算法 .该算法利用 Bayes和 TFIDF两种分类器结合少量已标记和大量未标记文档协同增量训练 .实验结果表明 ,协同训练算法正确率较高 ,平均错误率较 EM和联合训练低 。
- 彭雅林亚平陈治平
- 关键词:文本分类EM算法