Танцы присутствовали в любой культуре на протяжении всей истории человечества и являются одной из древнейших форм нашего самовыражения. Однако скоро наша монополия на движения под музыку может закончиться, так как команда Facebook AI решила научить двигаться в такт ИИ.
Это не первая попытка научить искусственный интеллект танцевать. В 2016 году шведский хореограф Луиза Црнкович-Фриис и ее муж, Лука Црнкович-Фриис, генеральный директор компании Peltarion, использовали 48 часов записей танцевальных движений Луизы для обучения рекуррентной нейронной сети Chor-rnn. Их система могла не только воспроизводить новые танцы, но и делать это в определенном стиле. В 2017 году Уэйн МакГрегор, хореограф Королевского балета, объединился с Google Arts & Culture для разработки хореографического искусственного интеллекта, способного интерпретировать танцевальный стиль труппы и генерировать дополнительные движения на основе обучения на тысячах часов видео.
Однако эти системы просто имитировали показанные па. Конечно, они использовали полученные данные для создания новых движений, но они были основаны на наблюдении за тем, как танцуют люди, а не на собственном представлении о новых танцах. Более того, они были ограничены танцевальными стилями и музыкой, на которых тренировались. Нельзя было ожидать, что модель, обученная на классической музыке, сможет создать движения в стиле фанк или диско.
В этом смысле ИИ Facebook гораздо более стилистически гибкий. «Вместо того, чтобы пытаться подражать той хореографии, которая уже существует, - рассказал исследователь Facebook AI Деви Парих. - Мы хотели посмотреть, сможем ли мы создать что-нибудь новое».
Команда Париха обучала свою систему по 25 десятисекундным клипам из 22 песен широкого музыкального спектра - от традиционных африканских и китайских мелодий до современного рока и джаза. «Это поисковая процедура, при которой, получив входной музыкальный фрагмент, мы вычисляем матрицу представления, которая говорит нам, какие музыкальные элементы в двух разных точках во времени более похожи друг на друга, чем другие, - объясняет Парих. - И затем, мы используем процедуру поиска, чтобы найти танцевальную последовательность, матрица которой представляет тот же образец».
Так как танцевальные движения системы не основаны на человеческих, их графическое представление больше похоже на визуализатор Winamp, чем на то, что мы обычно воспринимаем как танец. В этом эксперименте команды танец принимал форму точки, двигающейся вперед и назад по прямой линии, серии пульсирующих волн или в виде грубо изображенной фигуры. Команда определяла, являлось ли движение танцем или нет, по уровню креативности, которая была одной из четырех базовых оценок.
По ее определению, танцы, в которых агент движется предсказуемо или которые не синхронизированы с музыкой, считались менее креативными. Затем сгенерированные танцы оценивались рабочими Amazon Mechanical Turk (AMT), которым показывали пары танцев и спрашивали, какие из них лучше сочетаются с музыкой.
Система все еще находится на ранней стадии разработки. Забегая вперед отметим, что Парих надеется научить нейронную сеть генерировать танцы непосредственно на основе входной музыки, без необходимости выполнения процедуры поиска. По его словам: "С точки зрения ИИ, творчество можно рассматривать как священный грааль, высший вызов интеллекту - нечто очень важное для того, что делает нас людьми".
Комментарии
(0) Добавить комментарий