才藏太 作品数:39 被引量:65 H指数:6 供职机构: 青海师范大学 更多>> 发文基金: 国家自然科学基金 国家社会科学基金 青海省科技厅基金 更多>> 相关领域: 自动化与计算机技术 语言文字 文化科学 更多>>
网络版班智达藏汉英电子词典的设计 被引量:7 2005年 近年来,随着计算机技术的发展,电子词典作为一种移动学习和翻译的数码工具,在国内外开始广泛地普及,其经济效益和社会效益也随之得到广大用户的关注。论文结合《班智达汉藏机器翻译系统》(国家863计划项目,编号为863-306-ZT04-05-2)的后续项目《班智达藏汉英电子词典》(国家自然科学基金,编号为69663001)的研发实践,论述了该电子词典在网络上的设计方案,重点讨论了电子词典的内容建设和结构描述以及网络中的开发模式和应用技术,最后对系统所选的平台进行了详细描述并给出了该电子词典的使用方法。 才藏太 李毛措关键词:电子词典 C/S模式 B/S模式 客户端 B+树 FGITA:一种基于细粒度对齐的多模态命名实体识别框架 2025年 命名实体识别任务旨在识别出非结构化文本中所包含的实体并将其分配给预定义的实体类别中.随着互联网和社交媒体的发展,文本信息往往伴随着图像等视觉模态信息出现,传统的命名实体识别方法在多模态信息中表现不佳.近年来,多模态命名实体识别任务广受重视.然而,现有的多模态命名实体识别方法中,存在跨模态知识间的细粒度对齐不足问题,文本表征会融合语义不相关的图像信息,进而引入噪声.为了解决这些问题,提出了一种基于细粒度图文对齐的多模态命名实体识别方法(FGITA:A Multi-Modal NER Frame based on Fine-Grained Image-Text Alignment).首先,该方法通过目标检测、语义相似性判断等,确定更为细粒度的文本实体和图像子对象之间的语义相关性;其次,通过双线性注意力机制,计算出图像子对象与实体的相关性权重,并依据权重将子对象信息融入到实体表征中;最后,提出了一种跨模态对比学习方法,依据图像和实体之间的匹配程度,优化实体和图像在嵌入空间中的距离,借此帮助实体表征学习相关的图像信息.在两个公开数据集上的实验表明,FGITA优于5个主流多模态命名实体识别方法,验证了方法的有效性,同时验证了细粒度跨模态对齐在多模态命名实体识别任务中的重要性和优越性. 吕学强 王涛 游新冬 赵海兴 才藏太 陈玉忠关键词:多模态 命名实体识别 信息抽取 知识图谱 《班智达藏文谜语系统》的设计与实现 2010年 《班智达藏文谜语系统》是为开发藏族儿童的智力,使他们在寓教于乐的快乐环境中掌握母语知识而精心研制的智力游戏,也是藏语语言知识资源的组成部分。目前在谜语数据库中收录了1120个谜语,并设计和开发了一个游戏界面,供孩子们玩猜谜语游戏,同时可以学习母语中丰富词语和优美的表达方式。本文主要介绍了该系统所涉及的工作及意义、设计宗旨、具体实现过程和准确答案选项位置的确定等内容。 才藏太关键词:游戏 知识库 智力开发 融合多特征和注意力机制的多模态情感分析模型 被引量:7 2024年 【目的】针对当前多模态情感分析中多模态特征提取不充分,模态内部信息和模态间交互信息结合不充分的问题,提出一种融合多特征和注意力机制的多模态情感分析模型。【方法】在多模态特征提取方面,增加视频模态中人物的肢体动作、性别和年龄特征;对于文本模态,融合基于BERT的字粒度语义向量和融合义原信息的词粒度语义向量,丰富了多模态数据的低层特征。利用自注意力机制和跨模态注意力机制以实现模态内部信息和模态间信息的充分结合。将各模态特征进行拼接,通过软注意力机制为各模态特征分配注意力权重,通过全连接层输出最终的情感分类结果。【结果】在公开数据集CH-SIMS和本文构建的热点舆情评论视频数据集HPOC上与Self-MM模型对比,实验结果表明,本文模型在CH-SIMS数据集上的二分类准确率、三分类准确率和F1值分别提升1.83、1.74和0.69个百分点,在HPOC数据集上分别提升1.03、0.94和0.79个百分点。【局限】视频中人物所处的场景可能不断变化,不同的场景可能蕴含不同的情感信息,模型未考虑融合人物所处的场景信息。【结论】本文模型丰富了多模态数据的低层特征,充分结合模态内部信息和模态间信息,能够有效提升情感分析的效果。 吕学强 田驰 张乐 杜一凡 张旭 才藏太关键词:多模态 情感分析 基于网络的教务管理信息系统的设计与实现 被引量:12 2005年 随着校园网的普及,建立一个具有通用性、开放性、实用性和灵活性的网络教学管理体系成为可能和必然趋势.本文结合笔者的硕士毕业设计项目《西北工业大学软件学院教务管理信息系统》的研发实践,论述了本系统的设计方案,包括网络拓扑结构、系统模块和数据库结构,介绍了系统所采用的软件平台和基本技术,最后说明了系统的特色所在. 才藏太关键词:C/S模式 B/S模式 客户端 数据库 基于规则的汉藏机器翻译系统中二分法的句法分析方法研究 本文结合973项目《支持舆情服务的汉藏机器翻译关键技术研究》的研制实践,论述了词项信息同语法规则相结合的原则,提出了以动词为中心的句法分析二分法,从而在受限语言的范围内,为建立有较大适应性的机器翻译规则系统,有效地提高机... 才藏太关键词:机器翻译 语句结构 句法分析 文献传递 教务管理信息系统中客户端的设计与实现 2006年 随着校园网的普及,建立一个具有通用性、开放性、实用性和灵活性的网络教学管理体系成为可能和必然趋势。本文结合西北工业大学软件学院教务管理信息系统的研发实践,论述了本系统的设计方案、功能模块划分、操作功能和安全策略的实现。 才藏太 曹玉兰关键词:C/S模式 B/S模式 客户端 校园网 一种藏语短语自动识别系统 本发明涉及藏语短语识技术领域,且公开了一种藏语短语自动识别系统,一种藏语短语自动识别系统,藏语识别模块包括:数据预接入模块:用于从大规模藏语语料库中提取文本数据;数据预处理模块:用于将每个词语拆解为字符级别,并通过词嵌入... 才藏太 香前 索南才让融合依存句法的深度学习藏语句子分割研究 2022年 藏语句子分割是藏语自然语言处理中的一项重要且基础性的研究工作。该文根据藏语句子结构特征,在分析藏语句子分割规则与难点的基础上,提出一种融合依存句法的藏语句子分割模型。该模型首先通过词嵌入和藏语依存句法信息嵌入将输入序列映射成实值向量;然后构建融合藏语依存句法的双向LSTM,拼接词语和句法信息特征,提高上下文时序特征的学习能力;最后利用CRF预测出最佳句子分割点。通过对比实验,验证了该模型对藏语句子分割的有效性。实验结果表明,该模型的F_(1)值为99.4%。 头旦才让 仁青东主 尼玛扎西 完么扎西 完么扎西关键词:藏语 班智达汉藏公文翻译系统中基于二分法的句法分析方法研究 被引量:10 2005年 机器翻译系统是一种典型的自然语言处理系统,语言技术是机器翻译系统中居于核心地位的技术。本文结合863项目《班智达汉藏公文机器翻译系统》的研制实践,论述了词项信息同语法规则相结合的原则,提出了以动词为中心的句法分析二分法,从而在受限语言的范围内,为建立有较大适应性的机器翻译规则系统,有效地提高机器翻译语法分析的效率提供了有益的方法。 才藏太 华关加关键词:人工智能 机器翻译 语句结构 句法分析