赵蕾蕾
- 作品数:4 被引量:25H指数:3
- 供职机构:河北大学数学与计算机学院更多>>
- 发文基金:国家自然科学基金河北省自然科学基金河北省教育厅科研基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 使用Logistic回归模型进行中文文本分类被引量:12
- 2009年
- 使用Logistic回归模型进行中文文本分类,通过实验,比较和分析了不同的中文文本特征、不同的特征数目、不同文档集合的情况下,基于Logistic回归模型的分类器的性能。并将其与线性SVM文本分类器进行了比较,结果显示它的分类性能与线性SVM方法相当,表明这种方法应用于文本分类的有效性。
- 李新福赵蕾蕾何海斌李芳
- 关键词:LOGISTIC回归模型支持向量机文本分类
- 基于多特征模糊模式识别的公式符号关系判定被引量:8
- 2009年
- 数学表达式的识别过程中,结构分析是非常重要的一步。而符号关系的判定又是结构分析的关键。然而符号间关系的不确定性导致数学表达式运算含义的模糊性,已经成为数学公式识别中结构分析的一大难点。通过大量的统计数据,抽取出较为明显的特征,并引入多特征模糊模式识别的方法,建立隶属函数来判断印刷体数学公式符号的关系。实验结果表明,该方法适用范围较广,准确率较高,具有较强的鲁棒性。
- 田学东吴丽红赵蕾蕾
- 基于词和基本短语模式的特征提取方法
- Internet的发展带动了信息的迅速增加,如何从海量的信息中快速有效地找到有用的信息,已经成为亟待解决的问题。文本信息的自动分析可以有效地解决这一问题,而文本信息自动分析中的一个主要技术就是文本分类。文本分类技术可以使...
- 赵蕾蕾
- 关键词:文本信息特征选取词性标注
- 文献传递
- 基于CCIPCA和ICA降维的文本分类研究被引量:4
- 2008年
- 文本分类中采用向量空间模型来表达文本特征,维数巨大,关键是对高维的特征集进行降维处理,而一般的分解算法无法处理大规模的高维问题。采用CCIPCA与ICA相结合的特征提取方法可以有效地实现文本特征降维。实验结果表明降维提高了分类器的效率和效果。
- 何海斌李新福赵蕾蕾
- 关键词:文本分类特征降维支持向量机