靳聪 作品数:41 被引量:38 H指数:3 供职机构: 中国传媒大学 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 更多>> 相关领域: 自动化与计算机技术 电子电信 语言文字 兵器科学与技术 更多>>
视频处理方法、装置、电子设备及可读存储介质 本申请提供一种视频处理方法、装置、电子设备及可读存储介质。方法包括:将获取的语料内容输入完成训练的滑动窗口深度学习模型中;根据目标面部模型、语料内容的第一音素序列,通过滑动窗口深度学习模型生成目标面部模型的视频图像,视频... 靳聪 吕欣 郭越千 左翼翀 赵薇 李亚杰 谭丽锋 王君昊 王南苏 帖云DynArt ChatGPT:一个动态非遗年画的生成平台 2023年 ChatGPT吸引了跨领域的兴趣,因其提供了一个领域的会话能力和推理能力。年画是中国非物质文化遗产的重要组成部分,在过去,年画常作为一种主要的宣传手段。作为商品生产,其有着巨大的宣传推广量与经济价值。在以科技为主导的现代社会,中国非物质文化遗产的保护与发展遭遇到了发展经济、技术更新和文化变迁的三大矛盾,产生了传承乏人、创新不易、保护不力的诸多问题。为了弘扬与发展中国传统美术,本文产生了一个设想:能否将ChatGPT的会话功能与非遗文化中的传统美术进行组合呢?基于此设想,构建了一个系统——动态非遗年画生成系统(DynaArt ChatGPT)。DynaArt ChatGPT可通过提取ChatGPT给出的样例中的关键词,然后再根据关键词生成一段与样例相关的描述,并将描述输入到Lumen5模型中,Lumen5就会根据该输入的描述生成相应的动态视频,经过实验本文认为动态画生成系统可以对一些耳熟能详的中国民间故事进行全新的演绎。 靳聪 周满玲 张竣淞 王洪亮 王洪亮 王晶 王晶波场合成理论下的传声器阵列录音方法研究 被引量:8 2012年 应用波场合成理论(WFS)和边界采样定理,首次对交响乐音乐会进行16声道传声器阵列录音的尝试。对DMS边界采样录音原理、全直声系统、DMS相控阵传声器录音做了详细介绍,并对主观评价进行了分析。 吕小诗 靳聪关键词:多轨录音 一种虚拟对象的控制方法、装置、电子设备及介质 本申请提供了一种虚拟对象的控制方法、装置、电子设备及介质,该方法包括:接收到针对虚拟对象的第一文本信息后,根据文字拼音与发音的第一关联关系,将第一文本信息转换为第一语音数据;根据文字拼音与口型序列的第二关联关系,确定与第... 官奕聪 吕欣 靳聪 郭越千 左翼翀 张子涵 李晴基于强化学习的智能作曲研究 被引量:1 2020年 近年来,随着深度学习技术的不断进步,不少行业在应用人工智能技术之后产生了颠覆性的变革。那么,作为人类表达情感的重要方式之一,音乐与人工智能的结合将碰撞出怎样的火花?智能生成音乐是否能够像作曲家创作的音乐一样动听呢?本文以具有两个奖励网络的音乐生成模型——TRMG为例,研究人工智能是如何生成结构稳定、风格明显的高质量音乐的。 白勇 帖云 靳聪 李小兵关键词:人工智能技术 表达情感 颠覆性 基于模仿学习的机器人演奏示教系统 2024年 近年来,模仿学习被广泛应用于机器人领域,并展示出巨大的潜力。同时关注到智能系统在教育领域的应用越来越多样化,将机器人合理地应用到教学中可以提升教学效果,如果机器人可以教授一些专业技巧,如演奏乐器,可以为学生和人类老师都提供很大的便利。模仿学习特别适用于高度专业和技术性强的小提琴演奏,但在将专家演示引入动态运动原语(Dynamic Movement Primitive,DMP)的过程中,模糊性问题尤为突出,例如换弦角度的不确定性。传统的换弦角度测量方法如物理测量会有很大的误差且无法泛化,为了解决这一问题,提出了一种名为基于模糊和PCA的动态运动原语(Fuzzy Dynamic Movement Primitive for Teaching,T-FDMP)的新模型。该模型基于二型模糊模型和主成分分析(Principal Component Analysis,PCA)进行构建,使用主成分分析法(PCA)得到的特征变量(运弓角度)作为隶属度函数(琴弦角度)的输入进行学习,同时构建了一个专业级的音乐演奏行为数据库。仿生实验结果证明,所提出的T-FDMP模型能够以高精度控制机器人进行小提琴演奏,还为模仿学习在其他高度专业和技术性强的领域的应用提供了新的研究方向。 赵雨飞 靳聪 刘潇雨 王洁 朱永贵 李波关键词:模仿学习 机器人控制 智慧教育 基于多模态神经网络及规则算法的智能作曲研究 2019年 本文采用GAN和VAE结合深度学习网络进行基于音乐理论规则的智能音乐生成,探索智能生成音乐的算法。与传统的算法作曲不同,不需要手动的添加复杂的规则,而是通过训练初始音乐集、对乐曲集进行评估筛选,最后通过RVAE-GAN神经网络生成音乐。通过适应度函数计算乐曲一系列特征的加权和,如音高和节奏的分布,也可以计算与特定乐曲集之间的距离等一系列乐理理论规则。在此基础上,采用半监督算法形成和弦结构模型,结合乐曲的特征提取,研究并提出基于GAN对抗生成网络和VAE网络结合音乐理论规则的智能生成音乐对于现代流行音乐的创作和实现艺术的大众化和量产化具有重要的理论和实际意义。 靳聪 侯聪聪 程致远 张海茵关键词:神经网络模型 一种数据处理方法、装置、电子设备和存储介质 本申请提供了一种数据处理方法、装置、电子设备和存储介质,其中,该方法包括:获取目标视频的关键帧的属性特征向量;根据该关键帧的属性特征向量,得到该关键帧的特征向量;将该关键帧的特征向量和用于表示上一关键帧的音符的待排序向量... 靳聪 帖云 严文彩 李小兵 王南苏 吕欣 宋雷雨 李亚杰一种戏曲合成方法、装置和计算机可读存储介质 本申请提供了一种戏曲合成方法、装置和计算机可读存储介质,其中,该方法包括:获取目标语音和源戏曲唱段;按照所述目标语音的音色特征,将所述源戏曲唱段进行音色转换,得到与所述目标语音的音色特征匹配的转换后的目标戏曲唱段;基于所... 靳聪 陈小森 周帜 赵薇 李中仝 侯聪聪 李高玲 孙圆圆 张一民 王雪婷 帖云文献传递 一种数据处理方法、装置、电子设备和存储介质 本申请提供了一种数据处理方法、装置、电子设备和存储介质,其中,该方法包括:获取目标视频的关键帧的属性特征向量;根据该关键帧的属性特征向量,得到该关键帧的特征向量;将该关键帧的特征向量和用于表示上一关键帧的音符的待排序向量... 靳聪 帖云 严文彩 李小兵 王南苏 吕欣 宋雷雨 李亚杰文献传递