公共文化服务平台

2024年7月7日星期日

|

欢迎来到叙永县图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

单振宇: 作品数：12 被引量：3H指数：1; 供职机构：浙江大学更多>>; 发文基金：国家自然科学基金国家杰出青年科学基金国家高技术研究发展计划更多>>; 相关领域：电子电信自动化与计算机技术理学语言文字更多>>

合作作者

杨莹春浙江大学计算机科学与技术学院
吴朝晖浙江大学计算机科学与技术学院
潘纲浙江大学计算机科学与技术学院
黄挺浙江大学计算机科学与技术学院
李冬冬浙江大学计算机科学与技术学院

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

5篇会议论文
4篇专利
2篇期刊文章
1篇学位论文

领域

6篇电子电信
2篇自动化与计算...
1篇语言文字
1篇理学

主题

10篇语音
9篇说话人识别
6篇情感语音
4篇识别方法
4篇说话人识别方...
4篇情感
3篇声纹
3篇混合模型
2篇调节系统
2篇音乐
2篇音量
2篇音频
2篇语音频谱
2篇语音识别
2篇上下文
2篇上下文感知
2篇频谱
2篇平移
2篇情感模型
2篇自动调节系统

机构

12篇浙江大学

作者

12篇单振宇
11篇杨莹春
6篇吴朝晖
2篇潘纲
1篇李冬冬
1篇黄挺

传媒

1篇计算机工程与...
1篇浙江大学学报...
1篇第八届全国人...
1篇第二届和谐人...
1篇第二届和谐人...
1篇第八届全国人...

年份

1篇2011
1篇2010
3篇2009
2篇2008
3篇2006
2篇2005

共 12 条记录，以下是 1-10

全选清除导出

排序方式：

基于中性和情感声纹模型转换的说话人识别方法: 本发明涉及一种基于中性和情感声纹模型转换的说话人识别方法，包括如下步骤：(1)语音特征的提取：先进行音频预处理，音频预处理分为采样量化，去零漂，预加重和加窗三个部分；然后进行提取倒谱特征MFCC；(2)建立情感模型库：进...; 吴朝晖杨莹春单振宇; 文献传递

基于频谱平移的情感说话人识别方法: 本发明公开了一种基于频谱平移的情感说话人识别方法，包括如下步骤：(1)采集待测音频信号后，对音频信号依次进行采样量化、去零漂、预加重和加窗，得到加窗后的语音帧；(2)加窗后的语音帧经过快速傅立叶变换得到频谱信号，采用频谱...; 杨莹春吴朝晖单振宇; 文献传递

基于混合t模型的说话人识别方法: 本发明公开了一种基于混合t模型的说话人识别方法，包括如下步骤：1)特征提取：采集待识别的语音信号，对音频信号预处理，对预处理后的语音信号进行特征提取，得到语音信号的特征；2)说话人建模：采用混合t模型对语音特征建模，根据...; 吴朝晖杨莹春单振宇; 文献传递

基于语音音乐混合状态检测的音量自动调节系统: 日常生活中,人们的交谈经常受到背景音乐的干扰,需要用户手动的调节播放器的音量。这对用户来说是极其不方便的。本文介绍了我们开发的一个实时控制播放器音量的系统,它能感知背景音乐是否打扰到用户的谈话,据此自动调节播放器的音量,...; 单振宇潘纲杨莹春; 关键词：上下文感知背景音乐; 文献传递

基于频谱平移的情感说话人识别方法: 本发明公开了一种基于频谱平移的情感说话人识别方法，包括如下步骤：(1)采集待测音频信号后，对音频信号依次进行采样量化、去零漂、预加重和加窗，得到加窗后的语音帧；(2)加窗后的语音帧经过快速傅立叶变换得到频谱信号，采用频谱...; 杨莹春吴朝晖单振宇; 文献传递

MASC@CCNT:面向说话人识别的汉语情感语音库: 本文在对现有情感语音库进行综述和分析的基础上,提出并构建了用于说话人识别的情感语音库MASC@CCNT（Mandarin Affective Speech Corpus from CCNT Lab）,该语音库的特点是:针...; 杨莹春吴甜李冬冬单振宇黄挺; 关键词：情感语音说话人识别; 文献传递

基于语音音乐混合状态检测的音量自动调节系统: 日常生活中,人们的交谈经常受到背景音乐的干扰,需要用户手动的调节播放器的音量。这对用户来说是极其不方便的。本文介绍了我们开发的一个实时控制播放器音量的系统,它能感知背景音乐是否打扰到用户的谈话,据此自动调节播放器的音量,...; 单振宇潘纲杨莹春; 关键词：音乐上下文感知; 文献传递

声纹打卡系统: 声纹打卡系统是采用语音作为基本特征进行识别的认证系统。该系统的优点是安全性高,硬件便宜,用户管理容易。为了提高系统的运行效率,该系统采用了C/S体系结构。文中提出了合适的决策方法和模型更新技术,增强了系统的稳定性。该系统...; 单振宇杨莹春吴朝晖; 关键词：说话人识别; 文献传递

基于多项式拟合的中性-情感模型转换算法被引量：1: 2008年; 情绪变化问题是说话人识别技术面临的一个难题。为了解决该问题,提出了基于多项式方程拟合的中性-情感模型转换算法。该算法建立了中性模型和情感模型之间的函数关系,只需要说话人的中性语音就能训练其各种情感类型的说话人模型。在普通话情感语音库上的实验表明,采用该方法后识别算法的等错误率由16.06%降低到10.31%,提高了系统性能。; 单振宇杨莹春; 关键词：说话人识别高斯混合模型情感语音

基于UBM降阶算法的高效说话人识别系统被引量：2: 2009年; 为了提高基于高斯混合模型-通用背景模型(GMM-UBM)说话人识别系统的运算速度,提出了通用背景模型(UBM)降阶算法,该方法采用极大似然估计法训练一个高阶UBM,再采用UBM降阶算法得到低阶UBM.采用最短距离高斯分量替换空映射集合的方法解决了空映射集问题.通过实验方法分析了3种初始化低阶UBM方法的识别结果,发现不同的初始化方法对结果影响很小.在NIST2001 SRE数据库上的实验显示,该算法使基于GMM-UBM说话人识别系统的运算速度提高了8倍,而等错误率仅上升了4.59%,表明了UBM降阶算法在小幅降低系统识别率的情况下,可大幅度提高GMM-UBM系统的运行效率.; 单振宇杨莹春; 关键词：说话人识别高斯混合模型

全选清除导出

共2页<1 2>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有@叙永县图书馆 2015－2016 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张