用机器学习创造独特声音,谷歌开源 NSynth Super
也许没有人会想到 Google 竟然会发布一款合成器,而且这款叫做 NSynth Super 的合成器可不一般 —— 就像它的名字一样,这款合成器是基于深度神经网络学习系统,并且完全开源。
素材来源论智
什么是NSynth Super?
NSynth Super 是谷歌研究项目 Magenta 正在进行的实验中的一部分,该项目的目的是探索机器学习如何帮助艺术家一新方式创作艺术和音乐。
科技在创造新声音方面一直发挥着重要作用——从声音的扭曲到合成电音。今天,机器学习和神经网络的进步为声音的创作提供了新可能。
在过去研究的基础上,Magenta 创造了 NSynth(神经合成器)。这是一种机器学习算法,利用深度神经网络学习声音的特征,然后根据这些特征创造出完全新的声音。
相比于简单的将声音组合起来,NSynth 利用原声音的音色重新合成了全新的声音,所以你可以听到一半是笛子一半是西塔琴的声音。
自从 NSynth 发布后,Magenta 就不断尝试开发不同的音乐交互工具,想让 NSynth 算法更容易上手。作为探索的一部分,Magenta 与谷歌创意实验室(Google Creative Lab)合作,创造出了 NSynth Super。这是一款开源的实验性工具,音乐家能通过里面默认的4种原始声音生成全新的声音。现在这款产品的原型正在音乐人圈子里进行小范围的实验,评估他们使用的感受。
NSynth Super 是如何工作的?
在这个实验中,音乐家们在录音室里录制了跨 15 个音的 16 种原始声音源,然后将其输入到 NSynth 算法中,用算法生成新的声音。然后将生成的超过 10 万种新的声音加载到产品原型中。
每个旋钮代表四种不同的源声音,音乐家能通过控制旋钮选择不同音色,然后手指在触摸屏上滑动,将这四种声音结合起来。
NSynth Super 可以通过任何 MIDI 源播放,例如 DAW ,音序器或者键盘。
NSynth 算法是如何工作的?
根据个人水平、风格不同,NSynth 利用深度神经网络生成不同的声音。NSynth 直接从数据中学习,可以让艺术家直接控制音色和节凑,并能够手动探索创造新的声音。
NSynth 是一种算法,可以结合现有声音的特征来生成新的声音。为此,该算法将不同的声音作为输入。
使用自动编码器,它可以从每个输入中提取 16 个时间特征。然后将这些特征线性插入创建新的嵌入(每个声音的数学表示)。然后将这些新的嵌入解码成新的声音,这些声音具有两个输入的声音质量。
和 Magenta 其他项目一样,NSynth Super 建立在开源库之上,例如 TensorFlow 和 openFrameworks ,目的是让更多的艺术家、编程者和研究者体验这一创造性的过程。NSynth Super 的开源版本包含所有开源代码、简图和设计模板,都可以在GitHub上下载。
专业评分
专业评分已截止
评论
评论
推荐评论
暂无评论哦,快来评论一下吧!
全部评论(0条)