人工智能进军说唱初音未来微软小冰你知道多少

导读：人人皆可RAP？听上去很吸引人。作为人工智能的新尝试，爱说唱获得了不少目光，毕竟没有freestyle也没问题了。那么，还有哪些人工智能已经在乐坛上出道了？当下，说唱文化正逐渐在中国流行起来。《中国有嘻哈》、《中国新说唱》把说唱歌曲这类小众文化带到更广泛的人群面前。但对于普通用户来说，比起流行歌曲，“说唱”显然更有难度：节奏、押韵，说唱文化中的嘻哈态度都让人望而却步。但是最近，人工智能好像为我们解决了一部分难关。在百度上月举办的AI开发者大会上，百度副总裁沈抖携说唱歌手孙八一，发布了一款名为“爱说唱”的智能小程序：用户只需选择背景音乐，然后随便说出一段话，就可自动生成一段堪比专业的RAP歌曲。人人皆可RAP？听上去很吸引人。作为人工智能的新尝试，爱说唱获得了不少目光，毕竟没有freestyle也没问题了。那么，还有哪些人工智能已经在乐坛上出道了？今天我们就来盘点一下那些AI歌姬们。初音未来、洛天依说起“虚拟偶像”，几乎所有的宅友们脑海中跳出的第一个名字便是“初音未来”，作为世界上第一个举办演唱会的虚拟歌手，世界第一公主殿下的名号可以说是响彻云霄。初音未来，是2007年由Yamaha的VOCALOID系列语音合成程序为基础开发的虚拟少女偶像。对，你没有看错，这个葱色双马尾辫的少女的缔造者，是。事实上，看起来“不务正业”的除了生产摩托车以外，还是世界上最大的音乐乐器的生厂商，其中就包括了音乐合成器。2004年，开发了电子音乐制作语音合成软件核心引擎VOCALOID，就是初音未来和她的中国风妹妹洛天依的核心。根据目前主流的语音合成方式，Vocaloid采用的是“拼接合成”技术，使用者可以通过输入歌词和音符的方式直接生成歌曲，而歌曲的基础声音数据则来自于配音演员。如果需要创作一首新的曲子，使用者需要规划歌词和音调，编辑歌词和音调。并且可以更改每一个音符，对生成的＂唱词＂进行各项微调，包括呼吸力度、口的开合甚至颤音，通过这些调整，就可令原本破碎的声音数据变为连贯的类人电子声音。采用这种方式来创作，可以实现对歌曲最精确的控制，但另一方面，也很需要作者调整各项参数的功力。微软小冰不同于初音未来这种天生歌姬，微软小冰是半路出家，唱歌的原理也不一样——虚拟歌手需要录制好的声音库，再通过重新拼接声音库中的片段形成歌曲；而小冰唱歌是根据输入的信号做出发声的反应，也就是机器学习。如今的小冰已经更新到了，在音调、音质、自然度、衔接上都有了极大的改进，此外又加上了换气的声音和人类的演唱技巧，大大提高了演唱的自然度。佐藤莎莎拉佐藤莎莎拉是由基于HMM合成技术的声音创作软件CeVIO Creative Studio创造的虚拟歌姬，因其酷似真人的声音，被粉丝称为站立在现实和动画的交界处的女主角。CeVIO Creative Studio采用的算法在本质上与VOCALOID的＂拼接算法＂不同，HMM合成通过提取人声中的特征量建模，可以最大程度保留人声的特征，经过后期可以与VOCALOID媲美甚至更加接近人声，在声音的拟真度上可以说也并不逊于今天的小冰。在某种意义上，虚拟歌姬和小冰都是利用技术降低了艺术创作的门槛，但根本性的不同在于对这一问题的回答：科技在艺术创作中应该扮演什么样的角色？显而易见的是，小冰所代表的无疑是一个激进的科技派：利用科技的发展降低、乃至消除艺术创作的门槛，让技术引导人类的进步。而Vocaloid方面，尽管YAMAHA公司也一直在不断探索前沿的语音合成技术，在音乐创作上采取的却是最为传统的姿态：提供一个乐器，但将创作的自由完全归还给创作者。这种态度最大程度上回归了艺术的本源：人的自我表达，但另一方面，也在客观上保留了创作的门槛。在Vocaloid的圈子里，真正创造价值的仍然是创作者本身，在这里，技术让位于了人类。当然，以小冰的人工智能水平，我们并不需要讨论“人工智能威胁论”之类的东西，但现实的问题确实摆在眼前：在艺术创作领域，“大众”、“简便”的工业化生产似乎已经近在咫尺，而这种流水线生产真的就能完全取代专业而精密的调教了吗？对于创作者而言，“艺术创作”究竟是怎样一种行为，而对于观众们来说，他们欣赏艺术作品时，希望接收到的又是什么呢？其实艺术创作所赋予观众乃至社会的，并不是简单地文字优美、曲调生动，而应该是一种来自于现实社会的思想。

相关文章

卧式压力蒸汽灭菌器使用方法亲测宝典一学就会

医用水处理净化设备我来告诉你一个超实用的秘密如何让你的医疗器械更安全

化肥破碎机-高效分解农药残留生态环境新希望