Новая система, разработанная исследователями Массачусетского технологического института (МIТ), сможет обеспечить более рациональные методы взаимодействия роботов с людьми в сложных ситуациях, в том числе в ходе операций по ликвидации аварий. Новая модель поведения на 60 % сокращает необходимые коммуникации используемые командой роботов, значительно снижая лавину данных, с которыми должен иметь дело человек.
В процессе общения автономные роботы постоянно посылают друг другу в мельчайших деталях обновления о ходе решения задачи. Но значительная часть этих данных избыточна и только усложняет поставленную задачу. Кроме того, каждый раз при передаче обновления одной машине все ее коллеги должны отрабатывать действия по контролю состояния окружающей среды. Чем больше принимается информации, тем сильнее может замедляться работа.
Все гораздо сложнее в самых современных системах, где каждый робот известен в качестве агента. Приходится допускать, что принятая в настоящее время модель ситуации является точной, в тоже время учитывая возможную успешность дальнейших действий. Такие системы, известные как частично децентрализованные, наблюдаемые Марковские процессы принятия решений или Dec-POMDP, обрабатывают огромный объем информации, который постоянно транслируется между различными агентами.
Команда MIT поставила задачу сделать все проще, оптимизируя системы, чтобы сократить количество сообщений на 60 %. Работая в направлении создания системы, лучше подходящей для реагирования в экстренных ситуациях, они сначала удаляют какие-либо предварительные данные из модели ближайшего окружения агентов.
Пока это было уместно для некоторого приложения (аварийные службы часто имеют мало данных о рабочей среде). Это означает, что для того, чтобы заставить систему работать, у исследователей не было иного выбора, кроме как удалить часть системы, которая проверяет неопределенность эффективности каждого действия. Вместо этого, новая система считает, что любое предполагаемое действие завершается успешно.
Вместо того, чтобы передавать каждый кусочек информации, новая система позволяет агентам выбирать из трех вариантов каждый раз, когда происходит что-то новое, с выбором игнорирования новой информации, используя этот вариант самостоятельно и не распространяя на других агентов, либо передавая данные по всей сети. Каждый вариант имеет свои плюсы и минусы, и агенты обязаны определять ценность каждого решения, осуществлять постоянный анализ затрат и выгод, основанный на собственных действиях и ожидаемых действиях коллег.
Команда испытала модернизированную модель, используя более 300 смоделированных на компьютере задач. Фактически, результаты исследования только с роботами не были полностью положительными. Стандартный, постоянный метод коммуникации, на самом деле, показал лучшие результаты, на 2-10 процентов выше, чем новая, урезанная система коммуникации. Однако исследователи по-прежнему верят в свою новую модель, полагая, что тесты не наилучшим образом представили ее пригодность.
Заглядывая вперед, исследователи планируют испытать метод с командой, которая включает в себя робота и агентов из людей. Они также проводили эксперименты только с человеческими агентами, используя собранные данные, чтобы лучше понять, как человек общается в такой ситуации, и использовали результаты, чтобы улучшить системы для тестирования в будущем взаимодействия между человеком и роботом.
Комментарии
(0) Добавить комментарий