Одна из перспективных сфер применения искусственного интеллекта – автоматизированная обработка изображений. Частично благодаря огромному количеству фотографий других людей и самих себя, которые пользователи массово загружают в интернет, нейросети удается обучить работать с такими изображениями. Алгоритмы могут, например, «состарить» человека на фотографии или создать целую коллекцию реалистичных портретов людей, которых на самом деле не существует.
Можно с уверенностью утверждать, что сфера стоковых фотографий навсегда изменится с внедрением искусственного интеллекта. Однако Марио Клингеманн задался другим вопросом – что получится, если настроить нейросеть так, чтобы она генерировала лица под музыку, причем усилению ритма соответствовали бы самые яркие эмоции.
Клингеманн использовал систему искусственного интеллекта StyleGAN2, изначально созданную в Nvidia и опубликованную в открытом доступе около года назад. Разработчик не стал самостоятельно проводить дополнительное обучение нейросети, однако он настроил алгоритм с учетом звукового спектра аудиофайла, в данном случае, песни Triggernometry группы Kraftamt.
Некоторые подписчики Клингеманна в Twitter рекомендовали ему убрать из видеоролика особенно устрашающие изображения, созданные нейросетью. На самом деле, весь ужас некоторых фотографий можно оценить, только если постепенно просматривать видео кадр за кадром.
Комментарии
(0) Добавить комментарий