您的位置: 专家智库 > >

单振宇

作品数:12 被引量:3H指数:1
供职机构:浙江大学更多>>
发文基金:国家自然科学基金国家杰出青年科学基金国家高技术研究发展计划更多>>
相关领域:电子电信自动化与计算机技术理学语言文字更多>>

文献类型

  • 5篇会议论文
  • 4篇专利
  • 2篇期刊文章
  • 1篇学位论文

领域

  • 6篇电子电信
  • 2篇自动化与计算...
  • 1篇语言文字
  • 1篇理学

主题

  • 10篇语音
  • 9篇说话人识别
  • 6篇情感语音
  • 4篇识别方法
  • 4篇说话人识别方...
  • 4篇情感
  • 3篇声纹
  • 3篇混合模型
  • 2篇调节系统
  • 2篇音乐
  • 2篇音量
  • 2篇音频
  • 2篇语音频谱
  • 2篇语音识别
  • 2篇上下文
  • 2篇上下文感知
  • 2篇频谱
  • 2篇平移
  • 2篇情感模型
  • 2篇自动调节系统

机构

  • 12篇浙江大学

作者

  • 12篇单振宇
  • 11篇杨莹春
  • 6篇吴朝晖
  • 2篇潘纲
  • 1篇李冬冬
  • 1篇黄挺

传媒

  • 1篇计算机工程与...
  • 1篇浙江大学学报...
  • 1篇第八届全国人...
  • 1篇第二届和谐人...
  • 1篇第二届和谐人...
  • 1篇第八届全国人...

年份

  • 1篇2011
  • 1篇2010
  • 3篇2009
  • 2篇2008
  • 3篇2006
  • 2篇2005
12 条 记 录,以下是 1-10
排序方式:
基于中性和情感声纹模型转换的说话人识别方法
本发明涉及一种基于中性和情感声纹模型转换的说话人识别方法,包括如下步骤:(1)语音特征的提取:先进行音频预处理,音频预处理分为采样量化,去零漂,预加重和加窗三个部分;然后进行提取倒谱特征MFCC;(2)建立情感模型库:进...
吴朝晖杨莹春单振宇
文献传递
基于频谱平移的情感说话人识别方法
本发明公开了一种基于频谱平移的情感说话人识别方法,包括如下步骤:(1)采集待测音频信号后,对音频信号依次进行采样量化、去零漂、预加重和加窗,得到加窗后的语音帧;(2)加窗后的语音帧经过快速傅立叶变换得到频谱信号,采用频谱...
杨莹春吴朝晖单振宇
文献传递
基于混合t模型的说话人识别方法
本发明公开了一种基于混合t模型的说话人识别方法,包括如下步骤:1)特征提取:采集待识别的语音信号,对音频信号预处理,对预处理后的语音信号进行特征提取,得到语音信号的特征;2)说话人建模:采用混合t模型对语音特征建模,根据...
吴朝晖杨莹春单振宇
文献传递
基于语音音乐混合状态检测的音量自动调节系统
日常生活中,人们的交谈经常受到背景音乐的干扰,需要用户手动的调节播放器的音量。这对用户来说是极其不方便的。本文介绍了我们开发的一个实时控制播放器音量的系统,它能感知背景音乐是否打扰到用户的谈话,据此自动调节播放器的音量,...
单振宇潘纲杨莹春
关键词:上下文感知背景音乐
文献传递
基于频谱平移的情感说话人识别方法
本发明公开了一种基于频谱平移的情感说话人识别方法,包括如下步骤:(1)采集待测音频信号后,对音频信号依次进行采样量化、去零漂、预加重和加窗,得到加窗后的语音帧;(2)加窗后的语音帧经过快速傅立叶变换得到频谱信号,采用频谱...
杨莹春吴朝晖单振宇
文献传递
MASC@CCNT:面向说话人识别的汉语情感语音库
本文在对现有情感语音库进行综述和分析的基础上,提出并构建了用于说话人识别的情感语音库MASC@CCNT(Mandarin Affective Speech Corpus from CCNT Lab),该语音库的特点是:针...
杨莹春吴甜李冬冬单振宇黄挺
关键词:情感语音说话人识别
文献传递
基于语音音乐混合状态检测的音量自动调节系统
日常生活中,人们的交谈经常受到背景音乐的干扰,需要用户手动的调节播放器的音量。这对用户来说是极其不方便的。本文介绍了我们开发的一个实时控制播放器音量的系统,它能感知背景音乐是否打扰到用户的谈话,据此自动调节播放器的音量,...
单振宇潘纲杨莹春
关键词:音乐上下文感知
文献传递
声纹打卡系统
声纹打卡系统是采用语音作为基本特征进行识别的认证系统。该系统的优点是安全性高,硬件便宜,用户管理容易。为了提高系统的运行效率,该系统采用了C/S体系结构。文中提出了合适的决策方法和模型更新技术,增强了系统的稳定性。该系统...
单振宇杨莹春吴朝晖
关键词:说话人识别
文献传递
基于多项式拟合的中性-情感模型转换算法被引量:1
2008年
情绪变化问题是说话人识别技术面临的一个难题。为了解决该问题,提出了基于多项式方程拟合的中性-情感模型转换算法。该算法建立了中性模型和情感模型之间的函数关系,只需要说话人的中性语音就能训练其各种情感类型的说话人模型。在普通话情感语音库上的实验表明,采用该方法后识别算法的等错误率由16.06%降低到10.31%,提高了系统性能。
单振宇杨莹春
关键词:说话人识别高斯混合模型情感语音
基于UBM降阶算法的高效说话人识别系统被引量:2
2009年
为了提高基于高斯混合模型-通用背景模型(GMM-UBM)说话人识别系统的运算速度,提出了通用背景模型(UBM)降阶算法,该方法采用极大似然估计法训练一个高阶UBM,再采用UBM降阶算法得到低阶UBM.采用最短距离高斯分量替换空映射集合的方法解决了空映射集问题.通过实验方法分析了3种初始化低阶UBM方法的识别结果,发现不同的初始化方法对结果影响很小.在NIST2001 SRE数据库上的实验显示,该算法使基于GMM-UBM说话人识别系统的运算速度提高了8倍,而等错误率仅上升了4.59%,表明了UBM降阶算法在小幅降低系统识别率的情况下,可大幅度提高GMM-UBM系统的运行效率.
单振宇杨莹春
关键词:说话人识别高斯混合模型
共2页<12>
聚类工具0