Ученые МФТИ сокращают разрыв между виртуальным и реальным миром для робототехники. Новая система использует особый симулятор для точной настройки виртуальной модели робота. Такой "двойник", используя данные о его перемещении, в точности повторяет поведение робота и эффективно обучает алгоритмы для реального мира. Технология важна для создания маневренных и гибких agile-роботов: манипуляторов, курьеров, домашних помощников и других.
Препринт исследования опубликован на arxiv org, доклад по теме работы представлен на конференции International Conference on Intelligent Robots and Systems (IROS 2025).Чтобы антропоморфный робот двигался уверенно и не сбивался с пути, ученым необходимо четко знать его параметры: вес конечностей, демпфирование (подавление колебаний) или трение в суставах. Особенно это важно для обучения с подкреплением, где робот в виртуальной среде методом проб и ошибок учится выполнять задачи, получая «вознаграждение» за успешные действия.
На базе дифференцируемого симулятора MuJoCo-XLA, ученые МФТИ встроили этап «самонастройки» модели прямо в процесс обучения. Используя данные о положении, скорости и управляющих сигналах, симулятор сам вычисляет, как именно нужно изменить массу, трение и инерцию, чтобы поведение виртуального двойника совпало с поведением реального робота.
"Обычно чтобы точно определить параметры робота, на него приходится вешать множество дорогих и неудобных датчиков. Наша модель использует только данные о положении, скорости частей робота и управляющих командах, которые подаются на его моторы. На их основе симулятор оптимизирует параметры и настраивает виртуальную копию робота. Это позволяет уже реальному работу идеально повторять его сценарии", — рассказал Вячеслав Ковалев, аспирант МФТИ, программист лаборатории интеллектуальных технологий робототехники МФТИ.
Эксперименты на двуногом роботе Mini π показали: новый подход на 75% уменьшает отклонение и на 46% увеличивает пройденное расстояние в заданном направлении.
Видео-презентация разработки https://rutube.ru/video/7ed70a5987221421ee946461c5373923/
Модель учитывает сложные нелинейные эффекты, такие как трение в редукторах, для оптимизации которых могут использоваться нейронные сети. Это не только повышает точность, но и позволяет роботу экономить энергию, которую он раньше тратил на коррекцию ошибок и неустойчивое движение.
Это открывает путь к созданию agile-роботов — маневренных и гибких роботов, способных плавно передвигаться и быстро адаптироваться к изменениям в окружающей среде.

Комментарии
(0) Добавить комментарий