Когда человеку необходимо поднять по лестнице большую и тяжелую коробку, он может поднять эту коробку обеими руками, затем упереть ее в предплечья и прижать к груди, используя все свое тело для манипулирования.
Для робота каждое место, где коробка может соприкоснется с ним представляет собой событие контакта. При миллиардах вариаций быстрое планирование манипулирования становится неразрешимой задачей.
Исследователи из MIT нашли способ упростить этот процесс, известный как планирование манипуляций с большим количеством контактов. Они используют метод ИИ, называемый сглаживанием, который сводит множество контактных событий к меньшему числу решений, что позволяет даже простому алгоритму быстро определить эффективный план манипулирования для робота.
Многие решения, которые может принять робот, определяя, как манипулировать объектом, не являются важными с точки зрения общей схемы вещей. Например, каждая бесконечно малая поправка пальца, независимо от того, приведет ли она к контакту с объектом, не имеет большого значения. Сглаживание усредняет многие из этих неважных, промежуточных решений, оставляя несколько важных.
Обучение с подкреплением выполняет сглаживание неявно, пробуя множество точек контакта и затем вычисляя средневзвешенное значение результатов. Опираясь на этот опыт, исследователи Массачусетского технологического института разработали простую модель, которая выполняет аналогичное сглаживание, позволяя сосредоточиться на основных взаимодействиях робота с объектом и прогнозировать долгосрочное поведение. Они показали, что такой подход может быть столь же эффективным, как и обучение с подкреплением, при генерации сложных планов.
Даже если сглаживание значительно упрощает решения, поиск оставшихся решений все равно может оказаться сложной задачей. Поэтому исследователи объединили свою модель с алгоритмом, который может быстро и эффективно перебирать все возможные решения, которые может принять робот. При таком сочетании время вычислений на стандартном ноутбуке сократилось примерно до минуты.
Сначала они протестировали свой подход на симуляторах, где роботизированным рукам ставились задачи: переместить ручку, открыть дверь или поднять тарелку. В каждом случае подход, основанный на модели, достигал той же производительности, что и обучение с подкреплением, но за меньшее время. Аналогичные результаты были получены и при тестировании модели на реальных роботах-руках.
Пока этот метод находится на ранней стадии разработки, но в перспективе он может позволить заводам использовать небольших мобильных роботов, которые могут манипулировать объектами всей рукой или телом, а не большими роботизированными захватами. Это может способствовать снижению энергопотребления и уменьшению затрат. Кроме того, данная технология может быть полезна для роботов, отправляемых на другие планеты, поскольку они могут быстро адаптироваться к окружающей среде, используя только бортовой компьютер.
"Если мы сможем использовать структуру таких роботизированных систем с помощью моделей, то это позволит ускорить всю процедуру принятия решений и разработки планов, обеспечивающих контакт, - говорит Терри Сух, аспирант кафедры электротехники и информатики (EECS) и один из ведущих авторов статьи, посвященной этой методике.
В пресс-релизе MIT уточняется, что разработанная модель опирается на более простую аппроксимацию реального мира, поэтому она не может обрабатывать динамичные движения, например, падение объектов. Хотя этот подход эффективен для медленных манипуляционных задач, он не может создать план, который позволил бы роботу, например, выбросить консервную банку в мусорный бак. В будущем исследователи планируют усовершенствовать свою методику, чтобы она могла решать такие высокодинамичные задачи.
Результаты исследования опубликованы в журнале IEEE Transactions on Robotics.
Комментарии
(0) Добавить комментарий