Консалтинговая группа "Текарт" - центр компетенции "Робототехника".

Подробнее...
Основное меню
Категории новостей
Логотип

Новый ИИ читает по губам

Новое программное обеспечение (ПО) на базе ИИ называется WAS (Watch, AttendandSpell ), оно было разработано в Университете Оксфорда в сотрудничестве с компанией DeepMind.

Система ИИ использует компьютерное зрение и методы машинного обучения, чтобы научиться читать по губам, применяя для этого набор данных, включающий телевизионные кадры длительностью более 5000 часов из шести различных телепрограмм. В этих видео-фрагментах содержится более 11 8000 предложений и словарь из 17 500 слов.

Исследователи сравнили способности машины и человека-эксперта в распознавании речи по движениям губ говорящего. Они обнаружили, что ПО оказалось более точным. Человек правильно причитал по губам 12% сказанных слов, в то время как ПО WAS распознало 50% слов без ошибок. Неточности машины были небольшими, включая пропуск буквы "s" в конце английских слов.

Это ПО может найти целый ряд применений, в том числе помогая слабо слышащим людям ориентироваться в окружающем мире.

Есть также множество других вариантов использования. Например, диктовка инструкций по телефону в шумной обстановке, перезапись архивных немых фильмов, повышение эффективности автоматизированного распознавания речи в целом.

Комментарии

(0) Добавить комментарий

Ищите команду разработчиков? Не можете найти робота для своих нужд? Пишите нам!

Для обратной связи укажите ваш E-mail, он будет доступен только администратору. Так вы сможете оперативно узнать, когда ответ на ваш вопрос будет опубликован



Новые комментарии

Магнитные гусеничные роботы для очистки корпуса судна от продуктов биообрастания
Гость Николай Николаевич
29.12.2023
10:23:08
Очень нравится. Как возможно задействовать в наших водах Азов и Черное море