При всей шумихе вокруг беспилотных автомобилей они по-прежнему довольно неквалифицировано ведут себя во многих случаях, которые не представляют никаких проблем для человека, например, в таких ситуациях, как распознавание тротуара или светофора. Но возможно в скором времени эта задача приблизится к своему решению.
Ученые из Центра компьютерного зрения в Барселоне приходят на помощь с системой виртуального моделирования города – Synthia, которая сможет обучать искусственный интеллект (ИИ) вождению, распознаванию и обработке всех видов препятствий и ситуаций, даже в дождь или в сильный снег.
Нейронные сети, которые являются ключевым компонентом системы ИИ для вождения, проходят обучение по широкому набору изображений и видео из реальных ситуаций, чтобы точно распознавать различные «классы» объектов, таких как автомобили, пешеходы, дорожные знаки и так далее. Используя эти классы, программное обеспечение может попытаться интерпретировать вводимые в режиме реального времени данные с камер автомобиля и решить, следует ли двигаться вперед, тормозить или сигнализировать о смене полосы движения.
Во время вождения ИИ может собирать много данных о распространенных ситуациях, которые возникают при вождении по шоссе – относительно простму с точки зрения ИИ. Программному обеспечению гораздо труднее справиться с «частными случаями». Это такие редкие события, как дорожно-транспортные происшествия, поэтому они создают трудности при сборе достаточно большой выборки реальных данных, с которыми взаимодействует программа обучения автомобиля.
Еще хуже то, что изображения, используемые для обучения нейронных сетей, должны быть аннотированы вручную: то есть, кто-то должен кропотливо пройти через каждую картину и маркировать различные элементы на уровне пикселей, отделяя дорогу от тротуара или пешеходов от дорожных знаков. Это то, что Daimler сделал с проектом Cityscapes, вручную аннотировав более 20 000 изображений и разделяя объекты на 30 различных классов. В компании Mobileye, которая обеспечивает программное обеспечение, используемое системой автопилота Тесла, в настоящее время работают более 600 человек, чтобы вручную аннотировать 1000 изображений и видео к концу года.
Герман Рос и его команда из Барселоны нашли способ правильно аннотировать изображения автоматически и научить ИИ вождению. Как вести себя даже в самых необычных ситуациях можно теперь представить в видеоигре.
Используя популярный движок Unity , исследователи начали с создания реалистичной имитации не только города и его окрестностей, в комплекте с пешеходами, велосипедистами и плохо припаркованными автобусами, но и с учетом сложной метеорологической обстановки, которая включает дождь, снег и времена года. Затем они «построили» виртуальный автомобиль внутри симуляции, выбрали конкретное позиционирование и ориентацию для камер автопилота автомобиля и позволили автомобилю перемещаться в виртуальном мире, снимать видео и изображения с точки зрения камеры.
Поскольку программное обеспечение может определить с абсолютной точностью то, что сняли виртуальные камеры, система может генерировать очень большую коллекцию реалистичных, безукоризненно аннотированных изображений и видео, которые исследователи окрестили Synthia (Synthetic collection of Imagery and Annotations of urban scenario).
Исследователи собрали более 213 000 виртуальных изображений и видеофрагментов с целью обучения нейронных сетей на сочетании реальных и виртуальных образов, что позволит улучшить возможности распознавания объектов на дороге программным обеспечением ИИ на реальных изображениях.
Комментарии
(0) Добавить комментарий