Консалтинговая группа "Текарт" - центр компетенции "Робототехника".

Подробнее...
Основное меню
Категории новостей
Логотип

Новый ИИ читает по губам

Новое программное обеспечение (ПО) на базе ИИ называется WAS (Watch, AttendandSpell ), оно было разработано в Университете Оксфорда в сотрудничестве с компанией DeepMind.

Система ИИ использует компьютерное зрение и методы машинного обучения, чтобы научиться читать по губам, применяя для этого набор данных, включающий телевизионные кадры длительностью более 5000 часов из шести различных телепрограмм. В этих видео-фрагментах содержится более 11 8000 предложений и словарь из 17 500 слов.

Исследователи сравнили способности машины и человека-эксперта в распознавании речи по движениям губ говорящего. Они обнаружили, что ПО оказалось более точным. Человек правильно причитал по губам 12% сказанных слов, в то время как ПО WAS распознало 50% слов без ошибок. Неточности машины были небольшими, включая пропуск буквы "s" в конце английских слов.

Это ПО может найти целый ряд применений, в том числе помогая слабо слышащим людям ориентироваться в окружающем мире.

Есть также множество других вариантов использования. Например, диктовка инструкций по телефону в шумной обстановке, перезапись архивных немых фильмов, повышение эффективности автоматизированного распознавания речи в целом.

Комментарии

(0) Добавить комментарий

Ищите команду разработчиков? Не можете найти робота для своих нужд? Пишите нам!

Для обратной связи укажите ваш E-mail, он будет доступен только администратору. Так вы сможете оперативно узнать, когда ответ на ваш вопрос будет опубликован



Новые комментарии

Перспективы производства промышленных роботов в России
Мария
28.08.2024
08:13:38
Здраствуйте - можно ли узнать по поводу ультразвуковых датчиков мне для протезирования руки
Бесплатная мастерская для школьников и студентов
Гость
01.08.2024
06:19:40
Хорошая инициатива!