陈芯莹
- 作品数:9 被引量:50H指数:3
- 供职机构:西安交通大学外国语学院更多>>
- 发文基金:国家社会科学基金国家教育部“211”工程更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 汉语的计量特征在语言风格对比及作家判定中的应用——以韩寒《三重门》与郭敬明《梦里花落知多少》为例
- 提出了将语言计量研究成果应用于语言风格对比及作家判定中的方法。通过对两个75,000字的语料中12个语言结构特征分布的统汁对比,发现了7个具有显著分布差异的语言结构特征。并以这7个语言结构特征作为文本表示特征对两个75,...
- 陈芯莹李雯雯王燕王璐阚明刚
- 关键词:语言风格三重门梦里花落知多少
- 文献传递
- 应用HPSG理论实现汉语NP的自动分析
- 在汉语NP自动分析中,名词和量词的搭配问题是难点。本文在HPSG理论框架下,构建了汉语NP的形式化模型。并且重点分析了该模型在LKB系统中的实现情况。文章也总结了用LKB实现HPSG的优势与不足之处。
- 王璐璐陈芯莹李森林晨
- 关键词:NPHPSG
- 文献传递
- 计量特征在语言风格比较及作家判定中的应用——以韩寒《三重门》与郭敬明《梦里花落知多少》为例被引量:29
- 2012年
- 提出了将语言计量研究成果应用于语言风格对比及作家判定中的方法。通过对两个75000字的语料中12个语言结构特征分布的统计对比,发现了7个具有显著分布差异的语言结构特征。并以这7个语言结构特征作为文本表示特征对两个75000字的未知作家文本做了相关性分析,并准确判定了未知作家文本的作者。以语言结果的计量特征表示文本的方法加强了语言风格对比及作家判定研究的可解释性,具有较高的理论和应用价值。以语料库和统计方法进行语言结构特征计量研究是汉语语言风格描写研究及作家判定研究的重要方法。
- 陈芯莹李雯雯王燕
- 关键词:语言风格三重门梦里花落知多少
- 语义、句法网络作为语体分类知识源的对比研究被引量:2
- 2014年
- 基于6种语体的句法和语义树库分别构建了依存句法和语义网络,对这些网络的边数、节点数、节点平均度、聚类系数、平均最短路径长度、网络中心势、直径、节点度幂律分布的幂指数、度分布与幂律拟合的决定系数等整体特征进行了对比分析。以这些整体特征为变量,采用不同的聚类方法,对这6种语体的句法和语义网络进行了聚类分析。研究结果显示,同样是基于语言学原则构建起来的网络结构,依存句法网络和依存语义网络之间有明显差异。其参数的含义不尽相同,依据其各项参数所做的聚类实验的结果也不相同。采用语义网络的一些主要参数组合,可以获得相对合理的聚类结果,但不能很好地区分书面语体和口语体;通过句法网络的一些主要参数组合,可以很好地区分不同语体的文本,获得较为合理的文本聚类结果。
- 陈芯莹刘海涛
- 关键词:语体文本分类网络特征
- 汉语句法网络的中心节点研究被引量:19
- 2011年
- 以两种语体的汉语依存句法树库为基础,根据词频及分布率统计结果,选取3个汉语虚词作为研究对象.对提取的3个虚词节点进行了节点度数、点出度、点入度、接近性、内接近性、外接近性、中间度等网络特征的统计,并将这3个节点从网络中移除,对比分析网络前后的节点数、平均度、平均路径长度、网络直径、孤立节点数、最大范围、密度等网络特征的变化.结果表明,3个虚词均是网络的中心节点,但地位各有不同,它们对网络整体结构的影响也有较大区别.本研究不仅为汉语虚词的研究提供了新方法,也为复杂网络中的节点特性研究提供了新的思路.
- 陈芯莹刘海涛
- 关键词:复杂网络中心节点语言网络虚词
- 句法复杂网络作为语体分类的知识源研究被引量:6
- 2013年
- 基于6种语体的句法树库构建了6个依存句法网络,对这些网络的边数、节点数、节点平均度、聚类系数、平均最短路径长度、网络中心势、直径、节点度幂律分布的幂指数、度分布与幂律拟合的决定系数等整体特征进行了对比分析。以这些整体特征为变量,采用欧几里德的"最短距离"法,对这6种语体的句法网络进行了聚类分析。研究结果显示,通过一些网络的主要参数,即网络节点数、聚集系数、平均路径长度、中心势以及节点度幂律分布的幂指数,可以对所研究的文本进行分类。与传统的文本聚类方法相比,其结果更容易从语言学的角度进行合理的解释。
- 陈芯莹刘海涛
- 关键词:语体文本分类网络特征语言网络
- 汉语的计量特征在语言风格对比及作家判定中的应用——以韩寒《三重门》与郭敬明《梦里花落知多少》为例
- 提出了将语言计量研究成果应用于语言风格对比及作家判定中的方法。通过对两个75,000字的语料中12个语言结构特征分布的统计对比,发现了7个具有显著分布差异的语言结构特征。并以这7个语言结构特征作为文本表示特征对两个75,...
- 陈芯莹李雯雯王燕王璐阚明刚
- 关键词:语言风格三重门梦里花落知多少
- 文献传递
- 应用HPSG理论实现汉语NP的自动分析
- 在汉语NP自动分析中,名词和量词的搭配问题是难点。本文在HPSG理论框架下,构建了汉语NP的形式化模型,并分析了该模型在LKB系统中的实现情况,总结了用LKB实现HPSG的优势与不足之处。
- 王璐璐陈芯莹李森林晨
- 关键词:汉字处理词汇搭配语言分析数理语言学
- 文献传递