Команда исследователей из Института искусственного интеллекта AIRI, МФТИ и ФИЦ ИУ РАН заняла первое место в международном соревновании «Habitat Navigation Challenge 2023» по обучению «воплощенных интеллектуальных агентов» перемещению внутри помещений.
Система под названием SkillFusion помогла команде обойти соперников в умении передвигаться по комнатам без карты и искать различные объекты. Результаты были объявлены на крупнейшей научной конференции по компьютерному зрению CVPR в Ванкувере, Канада.
Роботы – это результат работы не только инженеров, но и исследователей ИИ. Для «оживления» машин ученые создают архитектуры управления – когнитивных/интеллектуальных агентов – программы, которые учатся самостоятельно взаимодействовать с окружающим миром и обучаться на своих ошибках. Они состоят из большого количества модулей и помогают разработчикам повышать степень автономности роботов.
Одна из наиболее важных задач для создания качественных роботов заключается в том, чтобы научить их правильно распознавать объекты и ориентироваться в помещениях. Приведем пример. Простая задача «налить чай» представляется роботу в виде сложной последовательности действий: найти кухню, открыть дверь, найти чашку, найти чайник, налить воду и так далее. Несложно научить машину выполнять этот алгоритм в специально созданной обстановке, когда каждый объект находится в строго отведенном месте, но, если мы хотим получить универсального домашнего помощника, необходимо обучить систему ориентации в пространстве. Робот должен правильно распознавать объекты – мебель и посуду, а также сцены – кухню, прихожую и так далее.
Международное соревнование по распознаванию объектов и сцен «Habitat Navigation Challenge» проводится с 2019 года. Основная задача участников – обучить агента находить заданные предметы в симуляторе различных помещений, например, квартир и офисов. Агент, оказываясь в ранее незнакомом помещении, должен найти нужный объект и подойти к нему как можно ближе за минимальное время. Исследователи должны обучить агента так, чтобы он мог выполнить эту задачу без карты помещения, используя для навигации только сенсорные данные.
В 2023 году соорганизаторами конкурса выступили Технологический университет Джорджии, Университет Техаса, Корнуэльский Университет, Университет Орегона и Университет Саймона Фрезера в Бернаби. В финале первое место заняла команда ученых из Института искусственного интеллекта AIRI, МФТИ и ФИЦ ИУ РАН под руководством кандидата физико-математических наук, ведущего научного сотрудника AIRI, Александра Панова. Техническим лидером команды выступил молодой научный сотрудник AIRI и аспирант МФТИ Алексей Староверов.
«В этом году организаторы сформировали задачу так, чтобы полученные решения можно было применять в создании реальных роботов. Теперь в данных есть не только реалистичные фото помещений, но и правдоподобные расположение камеры и движения робота. Наше решение сочетало в себе классические методы планирования и модули, работающие на основе обучения с подкреплением. Мы учли опыт предыдущих лет и предложили самый продвинутый и эффективный метод. Надеемся, что скоро он найдет свое применение в роботах-ассистентах», – отметил Александр Панов.
Архитектура агентов была схожа с недавно представленным роботом Hello Stretch, который оснащался камерой RGB-D и датчиком GPS+Compass. В задаче 2023 года использовалось 216 сцен и 6 категорий объектов: стул, кушетка, растение в горшке, кровать, туалет и телевизор.
Комментарии
(1) Добавить комментарий