您的位置: 专家智库 > >

时达明

作品数:7 被引量:43H指数:3
供职机构:大连理工大学电子科学与技术学院计算机科学与工程系更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 3篇期刊文章
  • 3篇会议论文
  • 1篇学位论文

领域

  • 7篇自动化与计算...
  • 1篇语言文字

主题

  • 5篇BLOG
  • 3篇情感分析
  • 3篇相关度
  • 2篇信息抽取
  • 2篇抽取
  • 1篇信息检索
  • 1篇语义
  • 1篇语义分析
  • 1篇属性约简
  • 1篇去除方法
  • 1篇网页
  • 1篇网页噪音
  • 1篇文本分类
  • 1篇向量
  • 1篇向量空间
  • 1篇向量空间模型
  • 1篇模板化
  • 1篇BLOGGE...
  • 1篇粗糙集
  • 1篇粗糙集属性约...

机构

  • 7篇大连理工大学

作者

  • 7篇时达明
  • 6篇林鸿飞
  • 1篇赵晶
  • 1篇倪茂树
  • 1篇杨志豪

传媒

  • 1篇计算机工程
  • 1篇计算机工程与...
  • 1篇郑州大学学报...
  • 1篇第五届全国数...

年份

  • 1篇2008
  • 6篇2007
7 条 记 录,以下是 1-7
排序方式:
基于网页框架和规则的网页噪音去除方法被引量:24
2007年
提出了一种基于网页框架和规则的网页去除噪音的新方法,该方法根据网页中HTML标签将网页分成若干部分,对各个table的长宽比属性进行比较,去掉长宽比很大的部分,并对其余table中的内容进行分析,根据内部是否存在和段落文字有关的标签


等来区分主题内容和噪音内容,在此基础上去除噪音内容。对来自CWT200G语料的132 559个网页进行测试后的结果表明,该方法可以有效地去除网页噪音,使索引文件减少约75%,大大地提高了检索速度,准确度也得到一定提高。

时达明林鸿飞杨志豪
关键词:信息检索网页噪音
Blog热点话题发现及其作者声誉度研究
目前对话题识别和话题跟踪的研究非常多,但这大都是对新闻事件进行分析。随着Web2.0的发展,人们对于网络的使用方式大大改变,即人的参与性大大增加,所以众多基于Web2.0的应用系统应运而生,其中Blog就是主要代表之一。...
时达明
关键词:BLOG情感分析
文献传递
基于内容相关度和情感分析的Blogger声誉度研究
Blog 是目前 Intemet 上一种非常重要的媒体,它可以提供给用户方便地发表自己的观点和评论, 其中的评论信息是 Blog 中重要的特点。本文提出了一种基于内容相关度和情感分析的 Blogger 声誉度研究方法,该...
时达明林鸿飞
关键词:BLOG情感分析
文献传递
基于内容相关度和情感分析的Blog作者声誉度研究
Blog是目前Internet上一种非常重要的媒体,它可以提供给用户方便地发表自己的观点和评论,其中的评论信息是Blog中重要的特点。本文提出了一种基于内容相关度和情感分析的Blog作者声誉度研究方法,该方法充分利用Bl...
时达明林鸿飞
关键词:情感分析
文献传递
基于模板化的Blog信息抽取被引量:8
2008年
Blog(博客)可以称为在线个人日志。作为一种新兴的媒体,Blog目前已经成为一种在Web上表达个人观点和情感的一种非常流行的方式。那么如何从Blog中快速准确地抽取有用的信息(话题发布时间、话题题目、话题内容、评论内容等)就成为了Blog应用中一个非常重要的步骤。提出了一种基于模板化的Blog信息抽取方法,该方法通过分析Blog网站的HTML源代码,然后提取出网站的模板,并根据该模板对Blog网页进行信息抽取。对来自国内10个著名博客网站进行模板的提取,并对这10个网站中的7374个Blog网页进行了实验,实验结果表明,该方法能根据提取出的模板快速、准确地对Blog网页进行信息抽取。
时达明林鸿飞赵晶
关键词:信息抽取
基于粗糙集属性约简的文本分类被引量:8
2007年
基于属性约简的方法,放弃以往复杂的规则匹配算法,提出将约简后的多种属性组进行析取,筛选特征项,并构造分类器.实验结果表明,此算法不仅简单,还能降低维数和提高分类结果.
倪茂树时达明林鸿飞
关键词:文本分类向量空间模型粗糙集属性约简
基于内容相关度和语义分析的Blog热点话题发现
目前对话题识别和话题跟踪的研究非常多,但这大都是对新闻事件进行分析,Blog 是目前 Internet 上一种非常重要的媒体,它可以提供给用户方便地发表自己的观点并可以对其他人的观点进行评论,其中的评论信息是其它新闻事件...
时达明林鸿飞
关键词:BLOG信息抽取语义分析
文献传递
共1页<1>