您的位置: 专家智库 > >

张卫强

作品数:77 被引量:219H指数:9
供职机构:清华大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家部委资助项目更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 37篇专利
  • 34篇期刊文章
  • 5篇会议论文
  • 1篇学位论文

领域

  • 29篇电子电信
  • 23篇自动化与计算...

主题

  • 33篇语音
  • 22篇语种识别
  • 16篇矢量
  • 11篇信号
  • 11篇语种
  • 10篇音频
  • 10篇语音数据
  • 10篇说话人识别
  • 9篇语音信号
  • 8篇向量
  • 8篇计算机
  • 8篇计算机设备
  • 6篇音素
  • 6篇语音识别
  • 6篇关键词
  • 6篇傅里叶
  • 6篇傅里叶变换
  • 5篇信号处理
  • 5篇语音信号处理
  • 5篇识别方法

机构

  • 71篇清华大学
  • 8篇北京理工大学
  • 5篇北京海天瑞声...
  • 4篇中国科学院电...
  • 4篇中国科学院大...
  • 2篇中国科学院
  • 1篇解放军信息工...
  • 1篇北京交通大学
  • 1篇郑州大学
  • 1篇江苏师范大学
  • 1篇中国航天
  • 1篇马凯特大学
  • 1篇清华信息科学...
  • 1篇清华大学深圳...
  • 1篇中国移动通信...

作者

  • 77篇张卫强
  • 49篇刘加
  • 8篇陶然
  • 6篇刘巍巍
  • 6篇何亮
  • 5篇栗志意
  • 5篇陈恩庆
  • 4篇赵鹏
  • 4篇刘艺
  • 4篇王浩
  • 4篇吴栋
  • 4篇周建华
  • 3篇夏善红
  • 3篇孟祥意
  • 2篇刘巍巍
  • 2篇蔡猛
  • 2篇徐嘉明
  • 2篇郭敏
  • 2篇邓妍
  • 2篇赵军红

传媒

  • 6篇电子学报
  • 6篇清华大学学报...
  • 5篇自动化学报
  • 4篇中国科学院大...
  • 2篇数据采集与处...
  • 2篇天津大学学报...
  • 2篇自然科学进展
  • 2篇信号处理
  • 1篇通信学报
  • 1篇计算机应用
  • 1篇北京理工大学...
  • 1篇兵工学报
  • 1篇信息安全研究
  • 1篇2007年全...
  • 1篇全国网络与信...

年份

  • 1篇2024
  • 2篇2023
  • 4篇2022
  • 4篇2021
  • 8篇2020
  • 4篇2019
  • 3篇2018
  • 2篇2017
  • 5篇2016
  • 3篇2015
  • 6篇2014
  • 5篇2013
  • 3篇2012
  • 7篇2011
  • 3篇2010
  • 3篇2009
  • 3篇2008
  • 6篇2007
  • 1篇2006
  • 3篇2005
77 条 记 录,以下是 1-10
排序方式:
多媒体技术在物理空间安全领域的应用与发展被引量:2
2016年
聚焦于以各种多媒体形式为栽体的信息处理技术在物理空间信息安全中的应用,阐述了语音、图像和视频相关的信息隐藏技术、数字水印技术、信息源识别技术以及多媒体取证技术等在安全领域的应用和发展现状,并对各种多媒体处理技术在信息安全领域的交叉应用和发展趋势进行了详细讨论.
赵军红张卫强郑明慧张萌黄伟庆
关键词:多媒体信息安全信息隐藏语音识别
语种识别方法及计算机设备
本发明提供了一种语种识别方法及计算机设备,首先获取多个语种的语音样本,通过多个语种样本中每一语音样本的每一音素序列的N元文法的特征超矢量的概率值与二叉决策树特征超矢量比较计算,再将所有音素序列的比较计算结果拼接得到每一语...
刘巍巍董太清周建华王希光唐玉建吴栋王浩赵鹏刘艺张卫强刘加
文献传递
基于声学模型共享的零资源韩语语音识别被引量:1
2023年
精准的语音识别系统通常使用大量的有标注语音数据训练得到,但现有的开源大规模数据集只包含一些广泛使用的语言,诸多小语种则面临着训练数据不足的问题。声学模型共享方法给出了这个问题的一种解决方法,它利用不同语种间的相似性,可以实现不需要小语种语音数据的语音识别。本文将声学模型共享方法扩展到韩语语音识别上,利用汉语声学模型构建韩语和汉语之间的音素映射关系。在不使用任何韩语语音数据的情况下构建的语音识别系统在Zeroth测试集上的字错误率达到了27.33%。同时本文还测试了不同映射方式之间的差异,结果表明这种共享模型的音素映射应当采用将目标语言词汇映射为源语言音素的方式。
王皓宇JEON Eunah张卫强李科黄宇凯
关键词:语音识别
一种不良前导音识别方法、装置、存储介质和计算机设备
本发明实施例提供了一种不良前导音识别方法、装置、存储介质和计算机设备。通过根据获取的多个语音数据生成每个语音数据对应的多维特征向量;根据多个多维特征向量生成每个语音数据对应的前导音概率;从多个前导音概率中提取概率最大值,...
于乐张卫强袁捷张峰李祥军江为强邱勤
基于语种对的鉴别式语种识别模型建立方法
基于语种对的鉴别式语种识别模型建立方法涉及一种用于语种识别的建模方法,其特征在于所述方法首先对语音数据提取特征得到特征矢量,接着采用Baum-Welch算法进行ML训练得到初始GMM模型参数,然后利用GMM模型对特征矢量...
张卫强刘加
音频识别方法和装置、计算机设备、计算机可读存储介质
本申请涉及一种音频识别方法和装置、计算机设备、计算机可读存储介质。所述方法包括:获取音频数据对应的音频特征。从预设的异构关系图中获取异构关系特征,预设的异构关系图用于表示训练集中音频数据对应的标签之间的关系;标签之间的关...
李金朋邵云飞张卫强
文献传递
网络音频数据检索技术被引量:14
2007年
针对网络海量数据的应用特点,对传统的直方图算法进行了改进,采用基于主轴树的快速矢量量化技术进行预处理,采用两阶段法进行搜索处理,实验结果表明这2种方法可以显著提高检索的速度和精度。
张卫强刘加
关键词:音频检索矢量量化
一种基于多任务神经网络的多样例关键词检测方法
本发明公开了属于语音信号处理技术领域的一种基于多任务神经网络的多样例关键词检测方法。方法具体包括以下步骤:在多语言的数据集上训练瓶颈深度神经网络、对目标数据集音频逐帧提取fbank特征和提取目标数据集的bottlenec...
张卫强杨建斌刘加
文献传递
采用注意力机制和多任务训练的端到端无语音识别关键词检索系统被引量:17
2020年
传统的关键词搜索(KWS,Keyword Search)系统依靠自动语音识别(ASR,Automatic Speech Recognition),通常在资源不足的情况下很难训练。为了免去训练完整的语音识别系统,无语音识别(ASR-free)的关键词检索系统受到越来越多的欢迎。本文提出了一个端到端(E2E,End-to-End)的关键词检索系统,该系统由两个编码器,两个解码器,一个注意机制和一个判别器组成。本文在所提出的系统中引入了注意力机制,该机制可以合并编码器输出的文本和音频特征从而辅助定位关键词所在的位置。在文本和音频解码器的不同组合情况下,使用Babel阿萨姆语和普什图语数据集测试系统。实验结果表明,相比于基线系统而言,该系统拥有更好的检测性能。相比于基于语音识别的关键词检索系统,该系统对于集外词(OOV,Out-Of-Vocabulary),在STWV(Supremum Term Weighted Value)指标上,取得了更好的效果。当训练数据量受限时,该系统比基于语音识别的关键词检索系统更具有优势。
赵泽宇张卫强刘加
关键词:关键词检索语音识别端到端
用于语种识别的约束异方差线性鉴别分析方法
用于语种识别的约束异方差线性鉴别分析方法涉及一种高维特征矢量的降维和去相关处理方法,其特征在于,所述方法首先由语音信号提取MFCC特征,选取连续M帧MFCC特征并列放置得到倒谱矩阵,然后将其按行展开,形成超矢量,再分块计...
张卫强刘加
文献传递
共8页<12345678>
聚类工具0