您的位置: 专家智库
>
作者详情>
艾克白尔帕塔尔
艾克白尔帕塔尔
- 作品数:7 被引量:35H指数:4
- 供职机构:新疆大学信息科学与工程学院更多>>
- 发文基金:国家自然科学基金教育部“新世纪优秀人才支持计划”新疆维吾尔自治区高技术研究发展计划项目更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于层次化结构的语言模型单元集优化被引量:5
- 2017年
- 对于大词汇量语音识别系统,适当选择基本单元至关重要。虽然以词为基本单元时避免了词边界的确定等复杂过程,但很多派生类结构中(如黏性语言),词比较长,而且很多文字(如中文、日文等)不需要词边界,因而在自然语言处理应用中没有选取基本单元集的固定模式。该文以维吾尔语大词汇量语音识别系统为例,研究基于各个层次化粒度单元的语音识别系统。通过比较各种层次化单元集为基础的语音识别结果,分析错误识别模式,收集被误判的单元序列作为在2层单元序列结构中择优的训练样本库。比较各种单元集的优缺点,提出一种能平衡长单元集和短单元集优点的方法。实验结果表明:该方法不仅可以有效提高语音识别准确率,也大大缩减了词典容量。
- 米吉提.阿不里米提艾克白尔帕塔尔艾斯卡尔.艾木都拉
- 关键词:语音识别语言模型层次化结构维吾尔语
- 微弱旋转效应的圆柱形介质光波导耦合器的研究
- 2009年
- 具有微弱旋转效应的两个平行圆柱形介质波导的微弱耦合是在矢量波动方程的基础上使用特异摄动法来解析的.对应于复合两个平行圆柱形介质波导系统的耦合模方程是满足麦克斯韦方程和边界条件的情况下得到的,此时摄动阶数限定在一阶范围内.可以发现具有微弱旋转效应的在两个平行波导的弱导内分别独立产生方向性耦合和偏振波的变换.方向性耦合是由耦合系数κ来控制,偏振波的变换是由耦合系数κ×来控制.
- 艾克白尔帕塔尔安元清俊
- 基于电话语料的维吾尔连续音素识别被引量:4
- 2012年
- 结合维吾尔语的语音特征和语义信息,在大量电话语音语料库的基础上,以建立维吾尔语连续音素识别平台为目标,通过构建隐马尔科夫模型工具HTK(Hidden Markov Model Toolkit)工具实现了维吾尔语连续音素识别算法:首先根据具体技术指标完成了较大规模电话语音语料库的录制和标注工作;确定音素为基元,通过训练获得了每个音素的HMM(Hidden Markov Model)声学模型,随后对输入的语音进行识别,声学模型在不同的高斯混合数目下,得出了识别结果;统计了32个音素的识别率并对它进行分析,为了进一步提高识别率奠定了基础。
- 米日古力.阿布都热素艾克白尔帕塔尔艾斯卡尔艾木都拉
- 关键词:维吾尔语声学模型
- 基于HTK的维吾尔语连续音素识别技术研究
- 2013年
- 以建立维吾尔语连续音素识别基础平台为目标,在HTK(基于隐马尔可夫模型的工具箱)的基础上,首次研究了其语言相关环节的几项关键技术;结合维吾尔语的语言特征,完成了用于语言模型建立和语音语料库建设的维吾尔语基础文本设计;根据具体技术指标,录制了较大规模语音语料库;确定音素作为基元,训练了维吾尔语声学模型;在基于字母的N-gram语言模型下,得出了从语音句子向字母序列句子的识别结果;统计了维吾尔语32个音素的识别率,给出了容易混淆的音素及其根源分析,为进一步提高识别率奠定了基础。
- 米日古力.阿布都热素米吉提.阿不力米提艾克白尔帕塔尔艾斯卡尔艾木都拉
- 关键词:维吾尔语声学模型语言模型
- 基于互信息的维吾尔文自适应组词算法被引量:6
- 2013年
- 传统的分词方法将一个维吾尔文语义词(多词关联模式)拆分成与词意义不符的若干个片段,因此在维吾尔语文本分析及文本处理过程中导致许多问题,严重影响文本处理效率。提出了一种维吾尔文组词的全新概念,用互信息作为相邻单词间关联程度的度量,实现了基于分段式策略和增量式策略的两种自适应组词算法,并与传统的分词方法得到的词汇表进行对比分析。实验结果表明,组词算法能够非常有效地提取文本中的语义词,两种算法在大规模文本集上的组词准确率分别达到了84.31%和88.24%。
- 吐尔地.托合提艾克白尔帕塔尔艾斯卡尔.艾木都拉
- 关键词:维吾尔文互信息组词
- 融合多策略的维吾尔语词干提取方法被引量:12
- 2015年
- 维吾尔语是形态变化复杂的黏着性语言,维吾尔语词干词缀切分对维吾尔语信息处理具有非常重要的意义,但到目前为止,维吾尔语词干提取的性能仍存在较大的改进空间。该文以N-gram模型为基本框架,根据维吾尔语的构词约束条件,提出了融合词性特征和上下文词干信息的维吾尔语词干提取模型。实验结果表明,词性特征和上下文词干信息可以显著提高维吾尔语词干提取的准确率,与基准系统比较,融入了词性特征和上下文词干信息的实验准确率分别达到了95.19%和96.60%。
- 赛迪亚古丽.艾尼瓦尔向露宗成庆艾克白尔帕塔尔艾斯卡尔艾木都拉
- 关键词:维吾尔语词干提取N-GRAM模型
- 语义词特征提取及其在维吾尔文文本分类中的应用被引量:15
- 2014年
- 基于机器学习的文本分类中,维吾尔文传统分词方法表现出非常明显的不足和局限性。该文使用另外一种维吾尔文自动分词方法dme-TS。dme-TS中,不再以词间空格作为切分标记提取词特征,而是用一种组合统计量(dme)来度量文本中相邻单词之间的关联程度,并以dme度量的弱关联的词间位置作为切分点,提取对学习算法真正有意义的语义词特征。实验结果表明,用dme-TS提取文本特征可以降低特征空间的维度,同时也能有效的提高传统以单词为特征的分类算法的性能。
- 吐尔地.托合提艾克白尔帕塔尔艾斯卡尔艾木都拉
- 关键词:文本分类