国家自然科学基金(60272039) 作品数:23 被引量:82 H指数:6 相关作者: 戴蓓蒨 李辉 周曦 陈雁翔 刘明辉 更多>> 相关机构: 中国科学技术大学 浙江师范大学 深圳大学 更多>> 发文基金: 国家自然科学基金 安徽省自然科学基金 更多>> 相关领域: 电子电信 自动化与计算机技术 更多>>
用于文本无关的话者识别的超音段信息提取 被引量:2 2005年 提出一种可用于较少语音数据量的文本无关的超音段信息提取方法。通过对基音和能量的轨迹动态分段,提取超音段信息,并使用异方差线性区分分析(HLDA)进行参数优化,克服超音段信息提取对数据量大小的依赖,同时采用混合高斯-统一背景(GMM-U BM)模型结构,建立文本无关话者识别系统。在N IST′01数据库上的实验表明,该系统性能优于基于短时帧的音源信息参数系统,更重要的是不需要大数据量的支持,且与基于短时帧倒谱参数的话者识别系统融合后,系统识别性能明显改善,等误识率相对下降10%。 姚志强 吴礼福 戴蓓蒨 周曦关键词:话者确认 基音 文本无关 文本无关说话人识别中一种改进的模型PCA变换方法 被引量:5 2007年 对于采用高斯混合模型(GMM)的与文本无关的说话人识别,出于模型参数数量和计算量的考虑GMM的协方差矩阵通常取为对角矩阵形式,并假设观察矢量各维之间是不相关的。然而,这种假设在大多情况下是不成立的。为了使观察矢量空间适合于采用对角协方差的GMM进行拟合,通常采用对参数空间或模型空间进行解相关变换。该文提出了一种改进模型空间解相关的PCA方法,通过直接对GMM的各高斯成分的协方差进行主成分分析,使参数空间分布更符合使用对角化协方差的混合高斯分布,并通过共享PCA变换阵的方法减少参数数量和计算量。在微软语音库上的说话人识别实验表明,该方法取得了比常规的对角协方差GMM系统的最优结果有相对35%的误识率下降。 姚志强 周曦 戴蓓蒨关键词:话者识别 解相关 一种改进的MELP语音编码方法 被引量:12 2003年 目前2.4kbps的混合激励线性预测(MELP)语音编码方法已经被确定为美国新的联邦语音编码标准。本文 提出了一种改进的MELP语音编码方法,利用滤波器相似度和基于LPC系数分类的矢量量化技术,可以把MELP的 码率降到1.7kbps以下,仍有较好的合成语音质量。 华国刚 戴蓓蒨 张钦 李辉关键词:MELP 语音编码 矢量量化 混合激励线性预测 音源特征用于提高话者确认系统的鲁棒性 被引量:2 2006年 给出了一种采用音源特征信息提高以声道倒谱参数为特征的话者确认系统噪声鲁棒性的方法,提取了两类音源特征参数:短时(单帧)特征参数和较长时(多帧)特征参数,并分别构建了两个利用音源特征参数的与文本无关的话者确认辅助子系统.采用线性加权对主、辅子系统的输出进行融合.在NIST’03数据库上100个男性话者的对比实验表明,音源特征参数具有良好的噪声鲁棒性,声道特征与音源特征具有较强的互补性,尤其是在较强的噪声背景下,利用音源特征可以有效地提高以声道倒谱参数为特征的确认系统的鲁棒性. 吴礼福 姚志强 戴蓓蒨 李辉关键词:话者确认 噪声鲁棒性 一种适于非特定人语音识别的并行隐马尔可夫模型 被引量:4 2004年 为了适合非特定人语音识别,提出了一种由多条并行马尔可夫链组成的并行HMM(Parallel Hidden Markov Model,PHMM),从而融合了基于分类的语音识别中为各个类别建立的模板,提高了识别性能,各条链之间允许有交叉,使得融合的多模板之间存在状态共享,同时PHMM可以在训练过程中自动完成聚类,且测试语音的输出结果来自所有类别,无需聚类分析和类别判断,这些都减少了存储量和计算量,汉语非特定人孤立数字的识别实验表明,PHMM较之传统CHMM使识别性能及噪声鲁棒性都得到了改善。 陈雁翔 戴蓓蒨 周曦 刘鸣关键词:非特定人语音识别 基于分类特征空间高斯混合模型和神经网络融合的说话人识别 被引量:6 2004年 该文提出了一种基于分类高斯混合模型和神经网络融合(FS-GMM/NN)的说话人识别方法,通过对特征矢量进行聚类分析,将说话人的训练语音分成若干类。然后根据各个类中含特征矢量的多少采用不同的模型混合度,训练建立分类高斯混合模型。并采用神经网络实现各个分类高斯混合模型输出的融合.在100个男性话者的与文本无关的说话人识别实验中,基于分类高斯混合模型和神经网络融合的方法在识别性能及噪声鲁棒性上都优于不分类的GMM识别系统,并具有较高的模型训练效率,且可以有效地降低话者模型的混合度和测试语音长度。 黄伟 戴蓓蒨 李辉关键词:说话人识别 高斯混合模型 神经网络融合 基于GMM多维概率输出的SVM话者确认 被引量:2 2008年 提出一种结合统计模型与区分性模型优点的说话人确认方法:基于GMM多维概率输出的SVM话者模型的说话人确认.以目标说话人的GMM模型对一条语音的不同特征分量的概率输出作为特征参数,建立目标说话人的SVM模型.在NIST’05 8conv4w-lconv4w数据库上的实验表明该方法的有效性. 刘明辉 戴蓓蒨 解焱陆关键词:说话人确认 文本无关 基于TZ Normalization规整的话者确认阈值选取 被引量:6 2005年 针对说话人确认中,各目标话者模型输出评分分布不一致而导致系统确认阈值设置的困难,本文采取了通过评分规整确定系统最小检测代价函数(DCF)确认阈值的方法。在分析了已有的两种评分规整方法Z norm a l-ization和T norm a lization的基础上,提出了一种结合两者优点的组合规整方法——TZ norm a lization,并据此给出了一种阈值动态修正方法,有效地提高了系统的性能和阈值选取的鲁棒性。对历年的N IST(手机电话语音)评测语料库进行了实验,表明了该方法的有效性。 刘明辉 陈继旭 戴蓓蒨 李辉关键词:说话人确认 NORMALIZATION 用于SVM话者模型训练的冒认话者选取 被引量:1 2009年 在基于支持向量机(SVM)的文本无关的说话人确认中,为提高SVM话者模型的训练效率和区分性能,提出2种基于高斯混合模型(GMM)的冒认话者选取方法——通过GMM概率评分,为每个目标说话人选取最接近的话者作为冒认话者用于SVM话者模型的训练,不仅提高模型的训练效率,而且提高SVM模型的区分性,有效地改进系统性能。在NIST’04 1side-1side数据库上的实验表明该方法的有效性。 刘明辉 黄中伟 戴蓓蒨 熊继平关键词:说话人确认 支持向量机 高斯混合模型 基于前置滤波和小波变换的带噪语音基音周期检测方法 被引量:14 2005年 根据语音信号的基音周期范围有限和在声门闭合时刻语音信号出现锐变的特点 ,提出一种基于前置滤波和小波变换的基音周期检测方法。带噪语音信号经过 3阶椭圆低通滤波器滤波后 ,采用以二次样条小波作为小波函数 ,进行一级小波变换检测语音信号的锐变点 ,再计算基音周期。实验表明 ,本文提出的基音周期检测方法 ,与平均幅度差函数 ( AMDF)和自相关函数 ( ACF)方法相比 ,提高了提取基音周期的准确率 ;与多尺度小波变换的基音周期检测方法相比 ,减小了计算量 。 李辉 戴蓓■ 陆伟关键词:基音周期 多尺度小波变换 低通滤波器 自相关函数 噪声信号