孔胜
- 作品数:6 被引量:21H指数:2
- 供职机构:大连理工大学管理学院更多>>
- 发文基金:教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术语言文字电气工程经济管理更多>>
- 港口数据立方体的关联规则挖掘
- 规则挖掘是数据挖掘研究的主要领域之一.本文在详细分析现有关联规则挖掘算法的特点、适用性和港口现有数据仓库建设的基础上,针对原始FP-growth算法在港口数据挖掘中的不足,引入了港口兴趣度概念,提出了一种港口多维多层关联...
- 王宇孔胜张承伟潘明霞
- 关键词:RULESCUBEINTERESTINGNESSPORT
- 文本资源的知识抽取研究
- 随着信息技术的广泛应用以及互联网的广泛发展,信息资源正爆炸性地增长。其中,80%的信息资源是以自然语言描述的文本形式存在,如何在海量的文本数据中获取最有效的知识,如何解决信息泛滥和知识贫乏的矛盾,是知识抽取研究的目标,而...
- 孔胜
- 关键词:自然语言处理知识抽取文本资源
- 文献传递
- 经济危机对中长期电力预测影响的实证研究
- 本文利用商务智能和数据挖掘中的相关方法来预测电力行业的未来市场需求,以电力负荷预测中的月售电量预测为例,通过对辽宁省近7年来的实际数据的深入分析,在实证验证了经济危机对电力负荷影响的规律性基础上,提出了一种多维分析预测的...
- 孔胜王宇张承伟
- 关键词:经济危机
- 基于句子相似度的文本主题句提取算法研究被引量:12
- 2011年
- 文本主题提取是文本挖掘领域的重要研究内容,解决文本信息泛滥的重要手段。为了解决现有文本主题句提取中一些局部主题容易被忽略的问题,本文提出一种"先分割,再提取"的思想。首先将文本表示为句子的线性序列,句子表示为词的线性序列,并对每个句子都预处理为含有实词的词汇链,然后基于知网(Hownet)计算相邻句子相似度。基于句子相似度,采用文本分割技术将文本分为多个关于子主题的句子包,通过句子关系图对这些句子包进行主题句提取。最后选用不同的语料库,设计进行了可接受性测试,实验结果验证该算法是可行、有效地。
- 孔胜王宇
- 关键词:句子相似度文本分割
- 经济危机对中长期电力预测影响的实证研究
- 本文利用商务智能和数据挖掘中的相关方法来预测电力行业的未来市场需求,以电力负荷预测中的月售电量预测为例,通过对辽宁省近7年来的实际数据的深入分析,在实证验证了经济危机对电力负荷影响的规律性基础上,提出了一种多维分析预测的...
- 孔胜王宇张承伟
- 关键词:经济危机
- 文献传递
- 一种基于正文特征的新闻网页抽取方法被引量:9
- 2010年
- 在统计分析了中文新闻网页的结构和内容特征的基础上,提出一种比较简单实用的基于正文特征的新闻网页抽取方法。该方法首先将HTML网页表示成基于XML的DOM树形式,利用统计的正文特征和节点信息从树中过滤掉噪音数据节点,最后再选取正文节点。该方法相比传统的基于包装器的抽取方法具有简单、实用的特点。实验结果表明,该抽取方法准确率达到94%以上,具有很好的实用价值。
- 孔胜王宇
- 关键词:DOM模型