尹燕飞
- 作品数:8 被引量:3H指数:1
- 供职机构:华中师范大学文学院语言学系更多>>
- 发文基金:教育部人文社会科学研究基金湖北省教育厅人文社会科学研究项目更多>>
- 相关领域:文学文化科学语言文字政治法律更多>>
- 基于大规模语料库的高频汉字串互信息分布规律分析
- 2014年
- 基于互信息的词典构建和自动分词是典型的基于统计的中文信息处理技术。通过计算大规模中文文本语料库的高频二字串、三字串、四字串的互信息发现:第一,高频词的互信息并不是很高,词和短语之间的互信息分布不存在明显界限;第二,高频无效汉字串的互信息与词和短语的互信息也没有明确界限,词、短语、无效汉字串互信息的夹杂分布,使得仅凭汉字串的互信息或频率很难高效地自动标注词、短语以及无效串。以上规律说明:单纯依赖对大规模真实文本语料库进行统计来实现高效的中文词典构建、自动分词处理等会面临极大挑战。
- 余一骄尹燕飞刘芹
- 关键词:短语语料库互信息
- 双宾结构中“借”类动词歧义考
- 2011年
- 存在"借"字一类的动词,在双宾语结构,即S+Verb+O1+O2中,当远宾语O2为钱财、房产等一类时,句子发生歧义。本文通过阐释动作方向性、时间性以及由此引起的物权分离来说明歧义产生的原因,并在词源学的意义上对四个动词词义的靠拢作解释和归纳。
- 杨卓灵尹燕飞
- 关键词:双宾语歧义近代汉语