Коллектив ученых из AIRI и МФТИ в партнерстве с Центром робототехники Сбера работает над созданием системы планирования действий роботов, которая позволит им выполнять обыденные для человека задачи по командам на естественном языке, а не по фиксированным сценариям.
Воплощенный искусственный интеллект позволит роботу самостоятельно формировать последовательности действий для решения задач, взаимодействуя с внешней средой в реальном мире. Система, построенная на основе такой технологии, обрабатывает информацию, ориентируется в пространстве и принимает решения. В результате робот должен суметь выполнять задачи по перемещению предметов по запросу пользователя на естественном языке, а не как ранее по заранее заданному разработчиком алгоритму в виде последовательности команд на языке программирования.
В настоящее время научить роботов понимать языковые инструкции – это настоящий вызов для разработчиков. Однозначное восприятие естественного языка, на котором люди говорят каждый день, непростая задача для роботов. Абстракции, обобщения, контекст, сленг могут изменять смысл слов и предложений и, как следствие, запутать их.
Управление роботами с помощью языковых команд усложняется еще и тем, что хотя ИИ добился значительных успехов в понимании письменного текста, идеально переводить это понимание на разговорный язык с его вариациями акцента, скорости и интонации он пока не умеет. Кроме того, роботы с трудом понимают неоднозначные команды и не «читают между строк», что вполне естественно для человека. А еще современные роботы, даже самые простые, управляются набором из написанных на языке программирования команд.
Чтобы использовать прогресс генеративных технологий для успешного применения ИИ в робототехнике, научная группа «Нейросимвольная интеграция» Института AIRI и Центр когнитивного моделирования МФТИ в партнерстве с Центром робототехники Сбера разрабатывают универсальный подход для планирования поведения роботов на основе больших языковых моделей. В будущем решение, позволяющее машинам понимать команды людей, можно будет подключить к роботам разного типа.
Одна из сложностей в реализации такого проекта – получение обратной связи от среды, в которой действует робот. Каждая квартира или офис уникальны, и привычные нам объекты – чашки, компьютеры, мебель – отличаются друг от друга.
Чтобы решить эту проблему, предложенная учеными система разбивает задачу на несколько частей в зависимости ситуации. Например, простая даже для ребенка просьба «положить все игрушки в ящик» оказывается совсем нетривиальной для ИИ. Он не обладает «здравым смыслом» и не знает, что такое «все игрушки». В такой ситуации робот должен преобразовать запрос в требование «сегментировать игрушки», собрать список найденных в комнате предметов и разбить задачу на этапы – то есть самостоятельно написать себе руководство по уборке каждого конкретного объекта.
В настоящее время ученые проводят эксперименты с использованием исследовательского робота-ровера с манипулятором.
«Современные большие языковые модели давно вышли за пределы чисто языковых задач и находят свое применение и в робототехнике. Наша команда одной из первых в мире продемонстрировала возможность составления иерархического плана действий робота с помощью языковой модели и показала, как такую модель можно встроить в сложную систему управления мобильным роботом. До этого выполнение языковых инструкций было возможно в основном для статических роботов-манипуляторов. Наша команда совместно со Сбером расширяет возможности применения как языковых моделей, так и самих роботов», - Александр Панов, к.ф.-м.н., руководитель научной группы «Нейросимвольная интеграция» AIRI.
Комментарии
(0) Добавить комментарий