Toyota Research Institute (TRI), Massachusetts Institute of Technology (MIT) и Columbia Engineering продемонстрировали результаты нового подхода к обучению ИИ, который значительно ускоряет скорость приобретения роботами новых навыков. Это похоже на ChatGPT для робототехники.
Ряд компаний решили, что пора вкладывать средства в человекоподобных роботов общего назначения, способных автономно перемещаться по существующим рабочим пространствам и заменять собой людей.
Однако большинство первых примеров сводятся к тому, что роботы будут поднимать и опускать предметы. Для того чтобы их действия расширились до уровня, когда они смогут зайти на любую рабочую площадку и начать выполнять самые разнообразные задачи, необходим способ быстрого изучения новых навыков на основе инструкций и/или демонстраций человека. Компания Toyota утверждает, что совершила прорыв, разработав новый подход к обучению на основе Diffusion Policy.
Diffusion Policy - это концепция, разработанная Toyota совместно с Columbia Engineering и MIT, которая позволяет легко и быстро обучать роботов новым навыкам на основе демонстрации. Более подробную информацию и примеры можно найти в исследовании "Diffusion Policy: Visuomotor Policy Learning via Action Diffusion".
По сути, если большие языковые модели (LLM), такие как ChatGPT, способны писать на уровне, близком к человеческому, то Diffusion Policy позволяет ИИ робота наблюдать, как человек выполняет ту или иную физическую задачу в реальном мире, а затем программировать себя на ее выполнение.
В то время как некоторые стартапы обучают своих роботов с помощью VR, подход Toyota в большей степени ориентирован на тактильные ощущения. Операторы получают тактильную обратную связь от мягких и гибких захватов робота через ручные пульты управления, что позволяет им в некотором смысле ощущать то, что "чувствует" робот при контакте с объектами.
После того как оператор несколько раз показал, как выполнять ту или иную задачу в различных условиях, ИИ робота строит свою собственную внутреннюю модель, а затем запускает тысячи симуляций, чтобы определить набор методов для ее решения.
На данный момент команда использовала этот подход для быстрого обучения роботов выполнению более 60 небольших задач, в основном бытовых (раскатывать тесто, почистить картофель, переворачивать блины и т.д.). Каждая из них относительно проста для взрослого человека, но требует от роботов самостоятельно разобраться в том, как захватывать, удерживать и манипулировать различными предметами.
В Toyota заявляют, что к концу этого года смогут обучить роботов сотням задач, а к концу следующего более тысячи. Сейчас компания разрабатывает первую большую модель поведения (Large Behavior Model, или LBM) - это полностью сгенерированная ИИ модель взаимодействия робота с физическим миром для достижения определенных результатов.
Комментарии
(0) Добавить комментарий