人工智能可以作曲吗？

冯诺伊曼在某次演讲中说到：

到底什么是计算机干不了的？只要你把被认为是计算机无法解决的问题描述清楚，计算机就能总能找到一种方法解决它。

也就是说，如果题主能把什么是作曲和好音乐定义清楚，计算机就可能实现你所想要的。

关于AI目前有多利害各位的回答已经比较详细了。但是，我要补充的正是创作好音乐这一过程中无法描述的谜题：人工智能和人类审美的关系。

关于人工智能有两种常见的误解：
1 认为机器是理性的无法生产出美的有意义的有感情作品；
2 认为机器不具有创造力，只能尽量模仿人类；

对于第一种误解，我想指出一段有限长度的旋律也是音符组合的一种。有限长度的音乐其组合也是有限的。即便一段听起来充满情感的乐句，只要有足够长的时间，计算机也能枚举出来。只不过计算机并不认为这条乐句有何特别，无非就是音符所有可能组合中的一个特例。机器也能制造被人类认为有情感的作品。

第二种误解常常源自于人们对历史上天才的感叹。这些所谓天才的作品如此震撼人心，使得人们相信他们身上有某种神秘的力量与智慧，因此认为机器只能模仿天才。但是，一首数百个音符的《月光》也是也是音符组合的一种。同上，只要给机器足够长的时间，我们都可以在其胡乱枚举出来的“作品”中找到天才一般的作品。（博尔赫斯的图书馆）

综上，AI能不能作曲这一问题就变成：计算机是否有某种算法，在自己生成的大量“垃圾”中，筛选出符合人类审美的作品。所以，“AI能不能作曲”不是一个计算机能干什么的问题，这个问题本质上是“人类能不能把审美品味抽象成计算机能理解的规则”

人类审美（什么是好音乐）是一个历史产物，也是一个不断流变的过程。固然我们的审美有一些通用的准则。但这些准则无法穷尽所有人类复杂的品味（ Tom Waits 好听么）。大部分情况下，我们都不知道自己喜欢什么。所以一些音乐推荐服务就产生了，如Pandora，Spotify。人工智能先驱Minsky曾经说过：“AI进展缓慢不是因为我们对计算机了解还不够，而是对我们自己了解不够。”

当然，如果真有人把人类审美规则抽象成计算机语言，让计算机在枚举出的“作品”中去搜索“伟大的作品”还涉及计算复杂度的问题。但良好的审美规则能大大减少搜索空间。天才之所以能创作脍炙人口的巨作，是因为他们在人类社会中长大，谙熟人类文化，精巧的把握了时代品味。天才怎么作曲的？其实他们也是试错试出来的。正因为他们对人性的了解，大大减少了试错次数。

关于题主问的计算机创作音乐是否经济上可行，值得推广，能否成为偶像，答案就很简单了：

不

对于流行乐，其创作过程相比于地图上色三体问题要简单多了。让人来干就好，根本不用动用每年电费上千万美元的“神机”。至于要创作“伟大的传世之作”，更不需要AI这么高级的技术。所谓莫扎特肖邦舒伯特，无非也是当时的流行音乐，或作者死后才流行起来的音乐。人类随着心情淘汰掉一些听烦了的流行乐，留给后世的就是“伟大的传世之作”。

AI作曲？大材小用。

===============================回复评论=================================
考虑到目前中文互联网已经被表演欲过剩的人占领了这一现状，我本来尽量想把答案写短，因此选择了比较通俗的表达方式，造成了一些误解。在此澄清。

1. 关于“流行”
我们常遇到一些言谈举止比较“老派”的人，在他们眼里伟大的艺术家和“流行”没有半点关系。在上文我把莫扎特等古典大师称作“当时的流行作家”，本意在于强调这些作品必须曾经有一定流行度，才得以被保存留给后世。Beethoven 和 Justin Bieber 当然是不一样的。但他们的作品都在受到过一定数量人的追捧。
伟大的作品被一定数量的人追捧传播难道不是好事吗？为何“流行”就成了贬义词？如果这样，听陈奕迅的会觉得凤凰传奇是流行，听莫扎特会觉得陈奕迅是流行，听巴赫的觉得莫扎特是流行，听勋伯格凯奇觉得巴赫是流行。最后在高度文明的外星人眼里，除了核电驱动播放的正弦波，其他地球音乐都是流行。
固然，有一些作品在我们心中的意义是超越审美的，是抚慰心灵的，是救赎灵魂的。但是艺术作品从开始传播直到呈现在你面前，就已经经历了一个被神化的过程。Alan Bloom是一名著名的古典学者。他曾经引述柏拉图把摇滚乐批得一文不值。结果被当时叱咤风云的摇滚了乐人Frank zappa撰文驳得哑口无言。Bloom是一个我挺喜欢的大学者，但是关于音乐他犯了一些错误。他把社会对某些作品的神化当作了作品本身超越时代的内隐特质。伟大作品取得伟大的历史地位，是和当时社会文化有关的。流行的音乐也可能成为伟大的音乐。
我刻意淡化古典作品复杂深邃的特征，而强调他们曾经流行过的事实，目的就是提醒大家不要犯和Bloom一样的错误。成就一个作品的“伟大”，不光是作品本身，还有社会对其评价讨论。人只有经过社会化，才能欣赏艺术作品。每个人都是带着他人为我们创造出的成见去听去看的。这种社会历史的二次加工是一个掺杂了审美，权力与支配，阶级区隔的复杂过程。

2. 关于“枚举”
我在回答中说计算机可以把伟大的作品“枚举出来”，想强调再伟大的音乐作品也只是所有音符组合的一个特例。这些所有音符组合构成的集合是递归可枚举的。但我的意思不是说“因为《月光奏鸣曲》是递归可枚举集合中的一个元素，所以计算机作曲枚举音符组合就ok了”。这只是AI有可能创作好音乐的前提。接下来AI的作用就是做两件事：1尽可能缩小搜索空间，2判断自己枚举出来的作品是否符合审美。这个题目下的回答大多集中讨论前者。因此，我的回答只讨论计算机是否可能具有“审美品味”。

最后一句“AI作曲，大材小用”被这句话一些人解读为“懂点计算机就指点江山”的傲慢。如果我没能让读者领会其中的幽默，请见谅。研究AI作曲固然有意义。但很多人以为AI的最终成功就是要奴役机器为我们完美服务。AI一直在应用方面不断取得突破。但是，AI领域最核心的问题“何为智能？”却迟迟没有答案。这个问题不但会颠覆人对机器的看法，最重要的让人类重新思考：”我们是什么？“ 。

把AI现今的发展与其最初为自己制定的理想主义蓝图相比较，我们看到的危机多于希望。最近一次大混战AI方法论 Noam Chomsky VS Peter Norving 最后也没争出可所以然来。

“AI作曲？大材小用。”是想提醒：当人类沉醉在被一个个天才妆点的历史中的时候，自恋遮蔽了理智，微不足道的成就被歌颂。而一些叛徒，他们敢于拷问那些光芒万丈的神话，他们才发现了机器所蕴含的无穷可能性，他们才有幸瞥见大自然的残酷。

3. 关于“AI作曲形式化”
这个讨论出现在问题的评论中。有人批评，AI作曲注定了只能创作形式化的音乐。而非形式化的音乐，比如中国的古琴。我想他的意思大概是是说AI作曲只能创作严格服从服从律法的音乐。

这是一个好问题。

AI作曲不一定需要律法。AI也可以创作调性自由甚至无调性的音乐。只要一段音乐的元素组合是递归可枚举的，AI就可以找到符合我们要求的音乐。不光是微分音，即便是连续变化的音（滑音），计算机也可以用插值的方法逼近。有人可能说：“我定义一个完美的正弦波，计算机再怎么插值都有误差”。但是，这个误差可以忽略不计。因为人耳辨识音高是有极限的。这个极限大概是3～4音分（100音分=半音），只要误差小于这个数值，人耳是听不出来的。

— 完 —

本文作者：知乎用户（登录查看详情）

【知乎日报】
你都看到这啦，快来点我嘛 Σ(▼□▼メ)

此问题还有 45 个回答，查看全部。
延伸阅读：
人工智能是什么？
Siri 属于语音识别还是人工智能？