THE LATEST INFORMATION
| 资讯中心 |
当Bretan运用了一个节奏更慢的基础旋律,Shimon则创作出有了一首截然不同的音乐,风格更为流畅。Shimon的第二首原创音乐之后问世了。必须认为的是,Shimon既没将有所不同的音乐单位机械地融合在一起,也没用于某种随便的音乐生成器,而是运用深度神经网络谱曲出有乐曲,这就是Shimon的特别之处。事实上,Shimon所谱曲的每一首音乐,都是其机器学习的成果。
它能总结和弦和和声,并像人类一样从大局抵达,将重点放到乐曲的整体结构上,而不是思维一段谱曲一段,简单机械地拼凑出下一部分的内容。Bretan把它叫作“高层次的音乐语义学”。目前来看,Shimon的音乐早已超过了“以假乱真”的境界,我们早已无法辨别出有它出自于机器人之手。Weinberg用“典雅、振奋人心、独有”来形容Shimon的音乐,我们十分赞成他的评价:它的音乐整体性和人与自然度十分低,同时别具一格。
为了理解更好的细节,我们通过email与Bretan和Weinberg展开了交流:IEEE Spectrum:你们先前上载了Shimon的弹奏视频,那么,你们是不是特地挑选了Shimon的优秀作品上载,而略为逊色的作品,则没上载呢?Gil Weinberg:视频中的音乐是Shimon运用深度自学创作的头两首曲子,我们并没特地自由选择。这两首曲子是Shimon自学的成果,它所自学到的内容让它享有了一个特定的数据库。你可以想象一下,如果我们让它自学的是其他的基础旋律,那Shimon谱曲出来的曲子将不会截然不同。IEEE Spectrum:如果你们只让Shimon自学一种类型的音乐(比如古典音乐,甚至某位特定作曲家或流派的古典音乐),那Shimon所创作的音乐是不是就需要可以具备辨识度呢?如果是,可以抵达何种程度呢?Weinberg:Shimon的音乐和它的训练内容息息相关,因此,如果我们只训练它吸取一位作曲家(或一种特定音乐流派)的作品,那么它创作出有的音乐风格将和此位作曲家(或此种音乐流派)十分完全一致,具备辨识度。
不过,影响其作品的还有另外一个最重要参数,那就是我们给与它的基础音乐参数,它能让Shimon的音乐构成自己的风格。IEEE Spectrum:为什么你训练Shimon同时吸取乐旨、反复乐段、小乐句和其他的基础音乐元素,和原始乐曲?它是如何将这微观和宏观的两者融合在一起的?Mason Bretan:我们想要让神经网络自学最重要的结构概念。我们自学写出故事,首先必需解读词、句、段等结构概念。
音乐创作也一样,我们必须解读乐旨、反复乐段、小乐句、乐章等结构概念。我们希望Shimon自学这些音乐概念,但我们并不是直截了当地告诉他它“这是乐旨、这是原始乐曲、这是小乐句”,而是动态地训练神经网络,让它需要新的排列组合基础音乐单位,在前一个或多个小节的基础上预测出下一个小节的内容。IEEE Spectrum:您能详尽地叙述下Shimon创作原创音乐的过程吗?Bretan:首先,它必须自学音乐小片段,比如单个或多个节奏,这个步骤叫作“神经映射”,这是最重要的一步。
在语言习得中,你或许听闻过词语矢量(word2ve或word to vector)”。何为“词语矢量”?通俗来说,就是让神经网络自学词语概念(比如“好”、“很好”、“无聊”、“精彩”等传达完全相同语义的词)。
音乐创作中也有一个与此类似的过程,神经网络必须自学音乐小片段,并须要知悉装载这些片段的载体。第二步,它必须自学音乐小片段的排序方式,并做出预测。
我们必须训练神经网络在有数的音乐小节的基础上,预测出下一个小节。清楚来说,这和一般的机器人增强自学不过于一样。一般来说,机器人要解决问题,自学的是一系列分离出来的动作。
但Shimon的自学方式则是持续的,它连续不断地预测排序方式,仍然正处于参数改版的状态之中。荐个例子,如果得出一个排列组合“1, 2, 1, 2, 1, 2, 1” ,并让Shimon预测数字“2”,那么在训练过程中,其预测的结果离“2”越大,其改版参数的强度就越大。因此,只要开始训练,Shimon就正处于预测状态之中。这样连续不断下去,最后一首曲子之后做成了。
IEEE Spectrum:Shimon有自己的创作风格吗?它创作的音乐和人类创作的音乐有何有所不同?Weinberg:机器人音乐创作的基本原理就是融合人类喜爱热衷的音乐(运用机器听力和机器学习)和新的音乐演奏和思维方式(运用人类不用于的算法)。深度自学架构目的捕猎被人类用于的音乐概念和模式。
我们可以在原先的算法上再加以机器为基础的数学排序,这样一来,之后能分解新奇的音乐。因此,Shimon的音乐听得一起“典雅、振奋人心、而独有”。IEEE Spectrum: 除了音乐创作,这种自学和即兴创作技术还有什么其他的实际应用于吗?Weinberg:我们正在将之运用在LSTM(宽短时记忆)网络和单位自由选择方法上,这两种方法类似于“即兴创作”,都可以应用于语言建模和语言分解领域。
IEEE Spectrum:那么,你们接下来的计划是什么?Weinberg:现在,我们早已开始计划运用深度自学来让机器人自学人类的音乐演出方式,而某种程度是自学符号记法。这样一来,机器人不仅能自学音乐符号,也能通过掌控微型计时、黏合、声调等参数,掌控弹奏音乐的方式,因此,其创作的音乐会更加非常丰富、让人印象更为深刻印象。
Bretan:接下来我的重点将转至机器人与人类的差异中来。Shimon有四只手臂,那么比起于两只手臂、十根手指的人类,其创作的音乐有何有所不同?四肢手臂又是如何影响音乐创作的呢?这个问题,我们还有待研究。Via: IEEE Spectrum版权文章,予以许可禁令刊登。
下文闻刊登须知。
本文来源:best365官网下载最新版本免费版-www.zgmiss.com