TRI представила метод обучения роботов новым навыкам

Toyota Research Institute (TRI), Massachusetts Institute of Technology (MIT) и Columbia Engineering продемонстрировали результаты нового подхода к обучению ИИ, который значительно ускоряет скорость приобретения роботами новых навыков. Это похоже на ChatGPT для робототехники.

Ряд компаний решили, что пора вкладывать средства в человекоподобных роботов общего назначения, способных автономно перемещаться по существующим рабочим пространствам и заменять собой людей.

Однако большинство первых примеров сводятся к тому, что роботы будут поднимать и опускать предметы. Для того чтобы их действия расширились до уровня, когда они смогут зайти на любую рабочую площадку и начать выполнять самые разнообразные задачи, необходим способ быстрого изучения новых навыков на основе инструкций и/или демонстраций человека. Компания Toyota утверждает, что совершила прорыв, разработав новый подход к обучению на основе Diffusion Policy.

Diffusion Policy - это концепция, разработанная Toyota совместно с Columbia Engineering и MIT, которая позволяет легко и быстро обучать роботов новым навыкам на основе демонстрации. Более подробную информацию и примеры можно найти в исследовании "Diffusion Policy: Visuomotor Policy Learning via Action Diffusion".

По сути, если большие языковые модели (LLM), такие как ChatGPT, способны писать на уровне, близком к человеческому, то Diffusion Policy позволяет ИИ робота наблюдать, как человек выполняет ту или иную физическую задачу в реальном мире, а затем программировать себя на ее выполнение.

В то время как некоторые стартапы обучают своих роботов с помощью VR, подход Toyota в большей степени ориентирован на тактильные ощущения. Операторы получают тактильную обратную связь от мягких и гибких захватов робота через ручные пульты управления, что позволяет им в некотором смысле ощущать то, что "чувствует" робот при контакте с объектами.

После того как оператор несколько раз показал, как выполнять ту или иную задачу в различных условиях, ИИ робота строит свою собственную внутреннюю модель, а затем запускает тысячи симуляций, чтобы определить набор методов для ее решения.

На данный момент команда использовала этот подход для быстрого обучения роботов выполнению более 60 небольших задач, в основном бытовых (раскатывать тесто, почистить картофель, переворачивать блины и т.д.). Каждая из них относительно проста для взрослого человека, но требует от роботов самостоятельно разобраться в том, как захватывать, удерживать и манипулировать различными предметами.

В Toyota заявляют, что к концу этого года смогут обучить роботов сотням задач, а к концу следующего более тысячи. Сейчас компания разрабатывает первую большую модель поведения (Large Behavior Model, или LBM) - это полностью сгенерированная ИИ модель взаимодействия робота с физическим миром для достижения определенных результатов.

Теги: Toyota, MIT

Новые комментарии

Первый в мире говорящий и ходящий робот Эрик может вернуться к жизни (+ видео)

Гапс Гость 008

25.04.2025

03:31:51

Удивительно!

Компания Tesla продемонстрировала своего робота

Pavel Mart

18.04.2025

11:47:57

На данном этапе роботостроения это мало эффективно - он может выполнять только ограниченные манипуляции заложенным человеком программным ...

Новости робототехники

TRI представила метод обучения роботов новым навыкам

Комментарии

Ищите команду разработчиков? Не можете найти робота для своих нужд? Пишите нам!

Новые комментарии

Другие статьи по теме

Категории