ИИ уже пишет музыку лучше 99% людей — и это только начало
Пора сделать какой-нибудь вывод из парада сгенерированной музыки
Помните фильм «Я робот»?
— Разве может робот написать симфонию? Взять чистый холст и превратить его в шедевр?
Может! Уже сейчас может, и делает это лучше 99% людей.
Что общего между нейросетями и музыкантами
Написание музыки — это процесс переработки собственного опыта. Музыканты не берут ноты из космоса, они получают в течение жизни чувственный опыт, формируют нейронные связи, а потом преобразуют опыт в тексты и мелодии, риффы и метафоры.
Хороший композитор от плохого отличается только тем, что понимает, что людям зайдет, а что говно сраное. Насмотренностью. Ну и качеством идей, которые приходят к нему в голову, «натренированностью» нейронных связей.
А ведь это ровно то, что делают нейронки. Продолжить предложение, угадать, какое слово поставить следующим, чтобы кожаному мешку понравилось. Какое слово, или какую ноту.
И новые жанры, новые идеи рождаются на стыке уже существующих. Блюз родился из рабочих песен рабов и госпела. Рок-н-ролл родился из блюза и кантри. Можете послушать песни сверху и убедиться, что нейросеть отлично справляется со скрещиванием 2-3 стилей в один.
Первые модели, генерирующие музыку, появились меньше 10 лет назад.
И уже сейчас они делают треки, которые нравятся людям. Комменты «сделал мою утро» и «до мурашек» это подтверждают.
Да что там, я сам уже второй день напеваю «Тэнгэр ээ». Я слушаю музыку с утра до вечера, у меня тысячи часов в год в Спотифае накручиваются, и музыка Суно мне нравится не меньше музыки, которую сыграл и свел живой человек.
Роль человека в производстве музыки сейчас
Сейчас в цикле производства музыки все еще очень важен человек. Я придумываю идеи, я задаю направление, я придумываю часть метафор, редактирую лирику, оцениваю качество генераций, докручиваю промты, переделываю плохие куски, выбираю самую интересную и стройную генерацию из десятков попыток.
Но даже сейчас Claude предлагает достойные идеи. Пишет достойные тексты. Придумывает запоминающиеся строчки.
Когда его сделают по-настоящему мультимодальным, когда он научится слышать звук, роль человека в этом процессе изрядно потускнеет.
Как будет выглядеть музыкальная индустрия через 10 лет
Агент может придумать миллион идей, миллион текстов. Он может оценить сам себя, выбрать те, которые имеют наибольший шанс понравиться определенной группе людей. Затем сгенерировать тысячи вариантов, переслушать их, улучшить инструкции, сгенерировать еще раз — и так пока не появится трек без изъянов и артефактов.
Ну а затем этот трек можно показать тестовой выборке в радио Спотифая, «моей волне» Яндекса, Flow Дизера, оценить их вовлеченность, отобрать то, что зашло больше всего…
И вот новый хит получился. Топ чартов. Сделанный автоматически без участия кожаных композиторов и музыкантов.
А если не хочешь слушать хиты, если ты нитакуся, которой нужен монгольский хип-хоп или дарк-кабаре про таксидермиста — то Спотифай тебе прям на ходу нагенерит качественной музыки под любое настроение. Такие сервисы с потоками нейромузыки уже есть, но пока что они делают что-то простое, фоновое. Однажды смогут делать что угодно.
Скриньте этот пост, через 10 лет музыкальная индустрия будет выглядеть так.
Молянов
В Телеграм канале каждый день рассказываю про бизнес, нейросети и диджитал. А еще показываю, как сочетать постоянные путешествия с предпринимательством и работой.