Консалтинговая группа "Текарт" - центр компетенции "Робототехника".

Подробнее...
Основное меню
Категории новостей
Логотип

TRI представила метод обучения роботов новым навыкам

TRI представила метод обучения роботов новым навыкам

Toyota Research Institute (TRI), Massachusetts Institute of Technology (MIT) и Columbia Engineering продемонстрировали результаты нового подхода к обучению ИИ, который значительно ускоряет скорость приобретения роботами новых навыков. Это похоже на ChatGPT для робототехники.

Ряд компаний решили, что пора вкладывать средства в человекоподобных роботов общего назначения, способных автономно перемещаться по существующим рабочим пространствам и заменять собой людей.

Однако большинство первых примеров сводятся к тому, что роботы будут поднимать и опускать предметы. Для того чтобы их действия расширились до уровня, когда они смогут зайти на любую рабочую площадку и начать выполнять самые разнообразные задачи, необходим способ быстрого изучения новых навыков на основе инструкций и/или демонстраций человека. Компания Toyota утверждает, что совершила прорыв, разработав новый подход к обучению на основе Diffusion Policy.

Diffusion Policy - это концепция, разработанная Toyota совместно с Columbia Engineering и MIT, которая позволяет легко и быстро обучать роботов новым навыкам на основе демонстрации. Более подробную информацию и примеры можно найти в исследовании "Diffusion Policy: Visuomotor Policy Learning via Action Diffusion".

По сути, если большие языковые модели (LLM), такие как ChatGPT, способны писать на уровне, близком к человеческому, то Diffusion Policy позволяет ИИ робота наблюдать, как человек выполняет ту или иную физическую задачу в реальном мире, а затем программировать себя на ее выполнение.

В то время как некоторые стартапы обучают своих роботов с помощью VR, подход Toyota в большей степени ориентирован на тактильные ощущения. Операторы получают тактильную обратную связь от мягких и гибких захватов робота через ручные пульты управления, что позволяет им в некотором смысле ощущать то, что "чувствует" робот при контакте с объектами.

После того как оператор несколько раз показал, как выполнять ту или иную задачу в различных условиях, ИИ робота строит свою собственную внутреннюю модель, а затем запускает тысячи симуляций, чтобы определить набор методов для ее решения.

На данный момент команда использовала этот подход для быстрого обучения роботов выполнению более 60 небольших задач, в основном бытовых (раскатывать тесто, почистить картофель, переворачивать блины и т.д.). Каждая из них относительно проста для взрослого человека, но требует от роботов самостоятельно разобраться в том, как захватывать, удерживать и манипулировать различными предметами.

В Toyota заявляют, что к концу этого года смогут обучить роботов сотням задач, а к концу следующего более тысячи. Сейчас компания разрабатывает первую большую модель поведения (Large Behavior Model, или LBM) - это полностью сгенерированная ИИ модель взаимодействия робота с физическим миром для достижения определенных результатов.

Теги: Toyota, MIT

Комментарии

(0) Добавить комментарий

Ищите команду разработчиков? Не можете найти робота для своих нужд? Пишите нам!

Для обратной связи укажите ваш E-mail, он будет доступен только администратору. Так вы сможете оперативно узнать, когда ответ на ваш вопрос будет опубликован



Новые комментарии

Большие языковые модели можно оптимизировать до 15% без потери качества
Гость
27.03.2026
12:54:31
Интересно, что в Сбербанке явно двигаются в сторону собственной оптимизации.
Нейросеть генерирует пугающие лица под музыку
Фанатка Франкенштейна
17.09.2025
03:22:03
Привет зловещая долина!)