冯诺伊曼在某次演讲中说到:
到底什么是计算机干不了的?只要你把被认为是计算机无法解决的问题描述清楚,计算机就能总能找到一种方法解决它。
也就是说,如果题主能把什么是作曲和好音乐定义清楚,计算机就可能实现你所想要的。
关于AI目前有多利害各位的回答已经比较详细了。但是,我要补充的正是创作好音乐这一过程中无法描述的谜题:人工智能和人类审美的关系。
关于人工智能有两种常见的误解:
1 认为机器是理性的无法生产出美的有意义的有感情作品;
2 认为机器不具有创造力,只能尽量模仿人类;
对于第一种误解,我想指出一段有限长度的旋律也是音符组合的一种。有限长度的音乐其组合也是有限的。即便一段听起来充满情感的乐句,只要有足够长的时间,计算机也能枚举出来。只不过计算机并不认为这条乐句有何特别,无非就是音符所有可能组合中的一个特例。机器也能制造被人类认为有情感的作品。
第二种误解常常源自于人们对历史上天才的感叹。这些所谓天才的作品如此震撼人心,使得人们相信他们身上有某种神秘的力量与智慧,因此认为机器只能模仿天才。但是,一首数百个音符的《月光》也是也是音符组合的一种。同上,只要给机器足够长的时间,我们都可以在其胡乱枚举出来的“作品”中找到天才一般的作品。(博尔赫斯的图书馆)
综上,AI能不能作曲这一问题就变成:计算机是否有某种算法,在自己生成的大量“垃圾”中,筛选出符合人类审美的作品。所以,“AI能不能作曲”不是一个计算机能干什么的问题,这个问题本质上是“人类能不能把审美品味抽象成计算机能理解的规则”
人类审美(什么是好音乐)是一个历史产物,也是一个不断流变的过程。固然我们的审美有一些通用的准则。但这些准则无法穷尽所有人类复杂的品味( Tom Waits 好听么)。大部分情况下,我们都不知道自己喜欢什么。所以一些音乐推荐服务就产生了,如Pandora,Spotify。人工智能先驱Minsky曾经说过:“AI进展缓慢不是因为我们对计算机了解还不够,而是对我们自己了解不够。”
当然,如果真有人把人类审美规则抽象成计算机语言,让计算机在枚举出的“作品”中去搜索“伟大的作品”还涉及计算复杂度的问题。但良好的审美规则能大大减少搜索空间。天才之所以能创作脍炙人口的巨作,是因为他们在人类社会中长大,谙熟人类文化,精巧的把握了时代品味。天才怎么作曲的?其实他们也是试错试出来的。正因为他们对人性的了解,大大减少了试错次数。
关于题主问的计算机创作音乐是否经济上可行,值得推广,能否成为偶像,答案就很简单了:
不
对于流行乐,其创作过程相比于地图上色三体问题要简单多了。让人来干就好,根本不用动用每年电费上千万美元的“神机”。至于要创作“伟大的传世之作”,更不需要AI这么高级的技术。所谓莫扎特肖邦舒伯特,无非也是当时的流行音乐,或作者死后才流行起来的音乐。人类随着心情淘汰掉一些听烦了的流行乐,留给后世的就是“伟大的传世之作”。
AI作曲?大材小用。
===============================回复评论=================================
考虑到目前中文互联网已经被表演欲过剩的人占领了这一现状,我本来尽量想把答案写短,因此选择了比较通俗的表达方式,造成了一些误解。在此澄清。
1. 关于“流行”
我们常遇到一些言谈举止比较“老派”的人,在他们眼里伟大的艺术家和“流行”没有半点关系。在上文我把莫扎特等古典大师称作“当时的流行作家”,本意在于强调这些作品必须曾经有一定流行度,才得以被保存留给后世。Beethoven 和 Justin Bieber 当然是不一样的。但他们的作品都在受到过一定数量人的追捧。
伟大的作品被一定数量的人追捧传播难道不是好事吗?为何“流行”就成了贬义词?如果这样,听陈奕迅的会觉得凤凰传奇是流行,听莫扎特会觉得陈奕迅是流行,听巴赫的觉得莫扎特是流行,听勋伯格凯奇觉得巴赫是流行。最后在高度文明的外星人眼里,除了核电驱动播放的正弦波,其他地球音乐都是流行。
固然,有一些作品在我们心中的意义是超越审美的,是抚慰心灵的,是救赎灵魂的。但是艺术作品从开始传播直到呈现在你面前,就已经经历了一个被神化的过程。Alan Bloom是一名著名的古典学者。他曾经引述柏拉图把摇滚乐批得一文不值。结果被当时叱咤风云的摇滚了乐人Frank zappa撰文驳得哑口无言。Bloom是一个我挺喜欢的大学者,但是关于音乐他犯了一些错误。他把社会对某些作品的神化当作了作品本身超越时代的内隐特质。伟大作品取得伟大的历史地位,是和当时社会文化有关的。流行的音乐也可能成为伟大的音乐。
我刻意淡化古典作品复杂深邃的特征,而强调他们曾经流行过的事实,目的就是提醒大家不要犯和Bloom一样的错误。成就一个作品的“伟大”,不光是作品本身,还有社会对其评价讨论。人只有经过社会化,才能欣赏艺术作品。每个人都是带着他人为我们创造出的成见去听去看的。这种社会历史的二次加工是一个掺杂了审美,权力与支配,阶级区隔的复杂过程。
2. 关于“枚举”
我在回答中说计算机可以把伟大的作品“枚举出来”,想强调再伟大的音乐作品也只是所有音符组合的一个特例。这些所有音符组合构成的集合是递归可枚举的。但我的意思不是说“因为《月光奏鸣曲》是递归可枚举集合中的一个元素,所以计算机作曲枚举音符组合就ok了”。这只是AI有可能创作好音乐的前提。接下来AI的作用就是做两件事:1尽可能缩小搜索空间,2判断自己枚举出来的作品是否符合审美。这个题目下的回答大多集中讨论前者。因此,我的回答只讨论计算机是否可能具有“审美品味”。
最后一句“AI作曲,大材小用”被这句话一些人解读为“懂点计算机就指点江山”的傲慢。如果我没能让读者领会其中的幽默,请见谅。研究AI作曲固然有意义。但很多人以为AI的最终成功就是要奴役机器为我们完美服务。AI一直在应用方面不断取得突破。但是,AI领域最核心的问题“何为智能?”却迟迟没有答案。这个问题不但会颠覆人对机器的看法,最重要的让人类重新思考:”我们是什么?“ 。
把AI现今的发展与其最初为自己制定的理想主义蓝图相比较,我们看到的危机多于希望。最近一次大混战AI方法论 Noam Chomsky VS Peter Norving 最后也没争出可所以然来。
“AI作曲?大材小用。”是想提醒:当人类沉醉在被一个个天才妆点的历史中的时候,自恋遮蔽了理智,微不足道的成就被歌颂。而一些叛徒,他们敢于拷问那些光芒万丈的神话,他们才发现了机器所蕴含的无穷可能性,他们才有幸瞥见大自然的残酷。
3. 关于“AI作曲形式化”
这个讨论出现在问题的评论中。有人批评,AI作曲注定了只能创作形式化的音乐。而非形式化的音乐,比如中国的古琴。我想他的意思大概是是说AI作曲只能创作严格服从服从律法的音乐。
这是一个好问题。
AI作曲不一定需要律法。AI也可以创作调性自由甚至无调性的音乐。只要一段音乐的元素组合是递归可枚举的,AI就可以找到符合我们要求的音乐。不光是微分音,即便是连续变化的音(滑音),计算机也可以用插值的方法逼近。有人可能说:“我定义一个完美的正弦波,计算机再怎么插值都有误差”。但是,这个误差可以忽略不计。因为人耳辨识音高是有极限的。这个极限大概是3~4音分(100音分=半音),只要误差小于这个数值,人耳是听不出来的。
— 完 —
本文作者:知乎用户(登录查看详情)
【知乎日报】
你都看到这啦,快来点我嘛 Σ(▼□▼メ)
此问题还有 45 个回答,查看全部。
延伸阅读:
人工智能是什么?
Siri 属于语音识别还是人工智能?