我们创建了 MuseNet,这是一个深度神经网络,可以使用 10 种不同的乐器生成 4 分钟的音乐作品,并且可以组合从乡村到莫扎特再到披头士的风格。MuseNet 并没有明确地根据我们对音乐的理解进行编程,而是通过学习预测数十万个 MIDI 文件中的下一个标记来发现和声、节奏和风格的模式。MuseNet使用与GPT-2,大规模变压器经过训练的模型可以预测序列中的下一个标记,无论是音频还是文本。
我们创建了 MuseNet,这是一个深度神经网络,可以使用 10 种不同的乐器生成 4 分钟的音乐作品,并且可以组合从乡村到莫扎特再到披头士的风格。MuseNet 并没有明确地根据我们对音乐的理解进行编程,而是通过学习预测数十万个 MIDI 文件中的下一个标记来发现和声、节奏和风格的模式。MuseNet使用与GPT-2,大规模变压器经过训练的模型可以预测序列中的下一个标记,无论是音频还是文本。