Люди учатся друг у друга с раннего возраста. Младенцы внимательно наблюдают за своими родителями, братьями и сестрами или воспитателями. Они наблюдают, подражают и воспроизводят увиденное, чтобы научиться новым навыкам и поведению.
То, как дети учатся и изучают окружающее пространство, вдохновило исследователей из Carnegie Mellon University (CMU) и компании Meta AI (компания Meta признана в РФ экстремистской организацией и запрещена) на разработку нового способа обучения роботов одновременному освоению нескольких навыков и их использованию для решения повседневных задач. Исследователи поставили перед собой задачу создать ИИ-агент с манипуляционными способностями, эквивалентными трехлетнему ребенку.
"RoboAgent - важнейшая веха на пути к созданию роботов-агентов общего назначения, которые будут эффективно обучаться, эффективно действовать в новых ситуациях и способны расширять свое поведение с течением времени, - сказал Викаш Кумар, адъюнкт-преподаватель School of Computer Science’s Robotics Institute. - Современные роботы являются узкоспециализированными и обучаются выполнению отдельных задач в изоляции. Мы поставили перед собой задачу создать единого агента ИИ, способного проявлять широкий спектр навыков. RoboAgent учится, как человеческий ребенок, - используя сочетание большого количества пассивных наблюдений и ограниченного количества активных действий".
RoboAgent может выполнять 12 манипуляций в различных сценах. Это исследование указывает на возможность создания роботизированной обучающей платформы, адаптируемой к изменяющимся условиям окружающей среды. В отличие от предыдущих исследований, команда демонстрировала свою работу в реальных условиях, а не на симуляторах, и при этом использовала гораздо меньше данных, чем в предыдущих проектах.
Созданный командой агент обучается на основе сочетания собственного опыта и пассивных наблюдений. Подобно тому, как родитель направляет своего ребенка, исследователи телеуправляли роботом, выполняя задания, чтобы он получал полезный опыт. Роботы учатся в первую очередь на собственном опыте, а не на том, что пассивно происходит вокруг них. Присущая им слепота к происходящему в окружающей среде существенно ограничивает как разнообразие опыта, получаемого роботами, так и их способность адаптироваться к новым ситуациям. Чтобы преодолеть эти ограничения, RoboAgent обучается на основе видеороликов в интернете - подобно тому, как дети приобретают знания и модели поведения, пассивно наблюдая за окружающей средой.
"RoboAgent использует информацию, содержащуюся в этих видеороликах, для получения предварительных знаний о том, как люди взаимодействуют с объектами и используют различные навыки для успешного выполнения задач, - говорит Мохит Шарма, аспирант кафедры робототехники. - Кроме того, наблюдение за схожими навыками в различных сценариях позволяет ему узнать, что необходимо, а что нет для выполнения задачи. Эти уроки он использует при решении неизвестных задач или в незнакомой среде".
"Агент, способный к такому обучению, приближает нас к роботу общего назначения, который может выполнять разнообразные задачи в различных условиях и постоянно развиваться по мере накопления опыта, - говорит Шубхам Тулсиани, доцент Robotics Institute. - RoboAgent может быстро обучить робота, используя ограниченное количество внутренних данных, и при этом опираться на многочисленные бесплатные данные из Интернета для решения различных задач. Это может сделать роботов более полезными в неструктурированных условиях, например, в домах, больницах и других общественных местах".
Обучаемые модели, база исходного кода, драйверы оборудования и весь набор данных, собранный в рамках исследования, находятся в открытом доступе. Команда надеется, что это позволит другим использовать, адаптировать и передавать его дальше, что со временем приведет к созданию действительно фундаментального робототехнического агента общего назначения. Более подробную информацию можно найти на сайте проекта.
Комментарии
(0) Добавить комментарий