索宏彬
- 作品数:9 被引量:21H指数:3
- 供职机构:中国科学院声学研究所更多>>
- 发文基金:国家自然科学基金国家科技支撑计划中国科学院战略性先导科技专项更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 一种基于带语言模型并行音节解码器的语种识别系统
- 本文介绍了中科院声学所研发的电话语音多语种识别系统。该系统采用多音素解码器并行处理框架,其中每一个解码器对每个目标语种都构建了 N 元语言模型—它表征了目标语种在语法层上的内在联系。多解码器对测试语音并行解码后,生成多个...
- 索宏彬李明吕萍颜永红
- 关键词:语种识别支持向量机
- 文献传递
- 高斯超向量-支持向量机鉴别性语种识别系统
- 2013年
- 支持向量机在语种识别技术中获得了广泛的研究和应用,并且达到和传统混合高斯模型相当的性能。高斯超向量-支持向量机系统将高斯混合模型与支持向量机有效地结合起来,采用高斯超向量核函数,以支持向量机作为后端分类器。重点介绍基于高斯超向量-支持向量机的语种识别系统,并和传统的高斯混合模型系统进行比较。在美国国家标准技术研究院2003年和2007年语种识别评测数据集上进行实验。实验结果表明,高斯超向量-支持向量机系统相对于混合高斯模型建模的方法,在长时数据上有较明显的性能优势。
- 梁春燕安茂波刘振业索宏彬汪俊杰
- 关键词:语种识别高斯混合模型支持向量机
- 联合因子分析和稀疏表示在稳健性说话人确认中的应用被引量:7
- 2012年
- 在说话人确认的任务中,为了解决信道失配问题,提高系统性能,引入了联合因子分析和稀疏表示算法。首先利用联合因子分析算法去除信道干扰,得到与信道无关的说话人因子,然后在稀疏表示算法中利用说话人因子构建过完备字典,求解稀疏最优化问题计算说话人得分。由于此方法有机结合了联合因子分析算法的信道鲁棒性和稀疏表示的鉴别性,使用此算法构建的系统在NIST SRE 2008电话训练、电话测试数据集上性能表现良好,相对于联合因子分析-支持向量机系统在性能上有竞争性,在原理上有互异性,系统融合更带来了最小检测代价指标上4.91%的性能提升。实验表明使用联合因子分析与稀疏表示进行说话人确认是可行的。
- 杨海张翔梁春燕索宏彬颜永红
- 关键词:稳健性说话人确认信道干扰支持向量机
- 一种基于带语言模型并行音节解码器的语种识别系统
- 本文介绍了中科院声学所研发的电话语音多语种识别系统。该系统采用多音素解码器并行处理框架,其中每一个解码器对每个目标语种都构建了N元语言模型─它表征了目标语种在语法层上的内在联系。多解码器对测试语音并行解码后,生成多个音节...
- 索宏彬李明吕萍颜永红
- 关键词:电话语音支持向量机
- 文献传递
- 说话人识别中的总变化因子分析技术
- 2013年
- 研究并实现了总变化因子分析(Total Variability Factor Analysis)技术,该技术在对说话人进行建模的时候,不区分语音中的说话人信息和信道信息,而是将整个语音空间(总变化空间)进行建模,然后在这个空间上对训练和测试语音计算其相应的总变化因子向量(Ivector),来作为支持向量机(Support Vector Machine,SVM)建模和分类的特征。为了降低信道对识别的影响,我们使用线性鉴别分析(Linear Discriminant Analysis,LDA)降维技术以及类内协方差规整(Within-Class Covariance Normalization,WCCN)技术对Ivector进行信道补偿。实验结果表明同时使用WCCN和LDA对Ivector进行信道补偿要好于单独使用WCCN或LDA;并且与传统的联合因子分析系统(Joint Factor Analysis,JFA)相比,以作为评价指标,在男、女测试集上,等错率(Equal Error Ratio,EER)分别相对降低1.20%和9.27%。
- 杨琳黄远杨晶超汪俊杰索宏彬
- 关键词:说话人识别信道补偿
- 基于高斯混合模型的说话人跟踪系统
- 当前说话人跟踪技术在国家信息安全,如电话监控, 互联网监控,以及电信增值业务中得到了广泛的关注。说话人跟踪系统目的在于将目标说话人在一段语音数据中进行定位。本文介绍一个应用于互联网监控的说话人跟踪系统, 本系统基于高斯混...
- 索宏彬刘晓星
- 关键词:说话人跟踪
- 文献传递
- 应用于短时语音语种识别的时长扩展方法被引量:7
- 2018年
- 为解决待识别语音时长小于10s时,语种识别性能急剧下降的问题,该文提出应用语音时域伸缩(time-scale modification,TSM)技术改变语音的长度(从而改变了语速),并保持其他频域信息不变。首先,对一段待识别语音,应用TSM技术转换为多条时域压缩和时域拉伸后的语音;其次,将这些不同语速的语音与原语音拼接起来,生成一个时长较长的语音;最后,送入语种识别系统进行识别。实验结果表明:所提出的语音时长扩展算法可以显著提升短时语音的语种识别性能。
- 苗晓晓张健索宏彬索宏彬颜永红
- 关键词:语种识别语速
- 长时语音特征在说话人识别技术上的应用被引量:8
- 2010年
- 本文除介绍常用的说话人识别技术外,主要论述了一种基于长时时频特征的说话人识别方法,对输入的语音首先进行VAD处理,得到干净的语音后,对其提取基本时频特征。在每一语音单元内把基频、共振峰、谐波等时频特征的轨迹用Legendre多项式拟合的方法提取出主要的拟合参数,再利用HLDA的技术进行特征降维,用高斯混合模型的均值超向量表示每句话音时频特征的统计信息。在NIST06说话人1side-1side说话人测试集中,取得了18.7%的等错率,与传统的基于MFCC特征的说话人系统进行融合,等错率从4.9%下降到了4.6%,获得了6%的相对等错率下降。
- 张建平李明索宏彬杨琳付强颜永红
- 关键词:语音特征识别技术说话人LEGENDRE高斯混合模型多项式拟合
- 基于高斯混合模型的说话人跟踪系统
- 本文介绍一个应用于互联网监控的说话人跟踪系统,本系统基于高斯混合模型,通过线性自适应得到目标说话人的统计模型.为了能更精细地定位出目标说话人的位置,本系统采用一种对输入的语音段先根据语音特征距离测度细切分后根据说话人得分...
- 索宏彬刘晓星
- 关键词:语音识别网络监控高斯模型
- 文献传递