В «Звездных войнах» вселенная заполнена роботами, которых часто называют дроидами. Среди них есть дроиды, выполняющие функции врачей, исследователей, рабочих, есть даже боевые дроиды. Они выполняют четко поставленные задачи, часто с определенной степенью независимости, не требующей взаимодействия с людьми. Сейчас мы имеем технологии, которые позволяют делать подобных дроидов. Но как обстоит дело с роботами, которые могут также взаимодействовать с людьми?
Что касается дроидов, подобных R2-D2 и C-3PO и нового ВВ-8 из очередной серии «Пробуждение силы», здесь перед нами гораздо более неоднозначная картина.
Два самых известных робота из Звездных войн специально предназначены для выполнения разных задач. R2-D2 официально является штурманом для пилотирования и обслуживания межпланетных кораблей. C-3PO – это дроид-переводчик со знанием языка и этикета. Они совсем не похожи друг на друга – гуманоид ростом со взрослого человека и робот, похожий на мусорный бак на колесах. Но очевидно, что членов команды их социальный интеллект полностью устраивает во всех отношениях.
Что касается таких базовых возможностей, как ходьба, разговор и восприятие окружения, мы сегодня все ближе и ближе к тому, что требуется. Наиболее совершенные гуманоидные роботы: Atlas от Boston Dynamics и Valkyrie от NASA уже хорошо ходят (и даже танцуют).
Также стремительно развиваются способности распознавания и синтеза речи. Например, Microsoft недавно добавила в Skype речевой перевод. Такие сенсорные технологии, как машинное зрение и даже искусственное обоняние также становятся все более похожими на человеческие возможности.
Непростой разговор
На самом деле, создание основных модулей конструкции для любого гуманоида, будь то С-3РО или вращающийся RР2-D2, чуть ли не самая простая задача. Реальной задачей является объединение этих компонентов, чтобы позволить роботам взаимодействовать в социально понятной манере.
Чтобы понять, почему это так трудно, давайте представим, что происходит, когда люди общаются тет-а-тет. Мы используем при этом одновременно разнообразный язык звуков, мимики и жестов. Удивительное количество информации при этом передается с помощью не речевых сигналов. На значение такого простого слова как «возможно» может кардинально повлиять ситуация, в которой находится собеседник.
На живое общение также накладывает свой отпечаток текущая ситуация. Разные люди могут появляться и исчезать, при этом история всех предыдущих взаимодействий также может оказывать большое влияние. И роботу необходимо не только полностью разобраться во всех нюансах взаимодействия с человеком, он также должен выдавать в ответ понятные и соответствующие сигналы. Все это говорит о колоссальной сложности.
По этой причине, сегодня даже самые совершенные роботы, как правило, действуют в ограниченных, в основном, лабораторных условиях. Они имеют ограниченные коммуникационные возможности и, как правило, могут взаимодействовать только в очень специфических ситуациях. Все эти ограничения сокращают количество сигналов, которые робот должен понимать и воспроизводить, но происходит это за счет снижения естественности взаимодействия.
Роботы и спрос
Однако уже имеется явный потребительский спрос на социально более интерактивных роботов. Начались продажи роботов Pepper. Производимые в Японии гуманоиды в натуральную величину могут ответить на вопросы, следуют инструкциям и реагируют на чувства и мимику собеседника. Потребительский спрос в Японии оказался настолько высоким, что с июля 2015 года все ежемесячно выпускаемые партии роботов в 1000 штук расходятся по предварительным заказам в течение одной минуты.
Между тем, робот Jibo побил рекорды на краудфандинговой площадке Indiegogo в июле 2014 года, когда он меньше, чем за неделю собрал $1 млн. в рамках сбора средств, сумма которых сейчас достигла $60 млн. Возможности созданного в Массачусетском технологическом институте в США, но еще не выпускаемого робота включают распознавание людей, поддержку разговора и запоминание особенностей собеседника.
Однако эти потребительские истории успеха по-прежнему не могут сравниться по степени эффективности с так любимыми многими дроидами из Звездных войн. Решение о том, как разрабатывать по-настоящему социально интеллектуальных роботов, таких как C-3PO, R2-D2 и BB-8, по-видимому, лежит в другой гиперактивной области исследований: обработка и анализ данных.
Первые интерактивные роботы действовали, как правило, на основе предварительно запрограммированных правил. «"Если человек говорит Х, скажи Y. В противном случае скажи Z». Однако недавно разработчики роботов перешли на машинное обучение, фиксируя взаимодействие между людьми или между людьми и роботами, а затем «обучая» роботов, как поступать, основываясь на имеющихся данных. Это позволяет роботу быть более гибким и адаптивным.
В рамках машинного обучения мы также видим большие новшества. Ранее роботы могли «узнавать» только после записи обработанных данных. Новые методы, такие как глубинное обучение, позволят роботам узнавать, как следует поступать, на основе «сырых» данных, что значительно расширяет их потенциал. Эти методы уже глубоко затронули распознавание речи и машинное зрение, а недавно Google открыл исходный код фирменного инструмента глубинного изучения TensorFlow, который должен принести пользу исследователям во всем мире.
Короче говоря, предстоит еще много работы, прежде чем мы сможем разрабатывать в полной мере социально-интерактивных роботов, таких как R2-D2 и C-3РО. Боюсь, маловероятно, что мы увидим полную версию любого из них в течение нашей жизни. Хорошей новостью является то, что это очень активная область исследования, технологии обработки и анализа данных быстро повышают социальный интеллект роботов. Мы в состоянии добиться вдохновляющих результатов в не слишком отдаленном будущем.
Комментарии
(0) Добавить комментарий