音乐在人类生活中扮演着不可或缺的角色。然而,为了创建高质量的音乐需要耗费大量的时间和精力。 Facebook人工智能研究部门近日推出的音乐生成技术或许能够缓解这个问题。

这项技术叫做“SOTA可控文本到音乐模型”,通过使用最先进的机器学习算法,它可以自动地从文字创作出高质量的音乐。此外,该技术可以按照指定的音乐属性实现更精确的生成控制。

这项技术的实现离不开Facebook研究部门提供的名为“音频工艺”(audiocraft)的开源工具包。据悉,这一工具包含了一整套音频处理算法,包括声音合成、音频编辑和播放等模块,可以控制听觉感知的特定属性,如强度、音高和音调等。

而SOTA可控文本到音乐模型是通过将输入的文本转换为所谓的“控制信号”,并将其输入到音频工艺算法中来实现音乐生成的。值得注意的是,这种方法还可以让用户指定音乐的不同属性,例如:风格、速度、情感等,以获得更多样化的音乐作品。

目前,这项技术还处在研究阶段,研究人员正在通过不断的更新优化它。虽然这项技术还不能取代真正的作曲家或音乐家创作,但是它无疑具有很大的潜力,可以帮助创作者更高效地添加音乐元素,让音乐变得更加多样化。

详情参考

了解更多有趣的事情:https://blog.ds3783.com/