Консалтинговая группа "Текарт" - центр компетенции "Робототехника".

Подробнее...
Основное меню
Категории новостей
Логотип

DeepMind добивается серьезного прогресса в области компьютерного зрения

Исследователи из компании DeepMind, являющейся сегодня частью Alphabet (одного из подразделений Google) представили детальное описание метода, который, как они говорят, поможет создать 3-х мерные изображения из нескольких 2-х мерных снимков.

До сих пор подобный метод, основанный на использовании глубоких нейронных сетей, был ограничен виртуальной средой. Естественные условия по-прежнему слишком сложны для обработки с использованием имеющихся алгоритмов и аппаратных средств.

Новый метод может быть полезен для любой системы видеонаблюдения, которая должна реконструировать преступление по нескольким снимкам. Беспилотные автомобили и бытовые роботы также смогут воспользоваться новой технологией одними из первых.

Исследователи приводят пример, когда рука робота может абстрактно рассматриваться в качестве простого сочленения с несколькими суставами, которые затем рассчитываются с использованием данных о форме, цвете и так далее.

Манипулируя первоначально этой абстракцией и заполняя впоследствии ее деталями, подобный метод сможет работать намного быстрее, чем системы рендеринга, которые пытаются манипулировать огромными наборами из 3-х мерных, связанных друг с другом точек.

Процесс мышления во многом можно отнести к чистому восприятию, которое для компьютеров является более сложным, чем для человека. Существует стандартный психологический тест на способности человека мысленно вращать объекты, которые используют геометрические фигуры, известные как объекты Шепарда-Мецлера. В видео, предоставленном DeepMind, нейронные сети классифицируют эти объекты в одном из двух видов: либо они являются версиями шаблона, который был повернут на одной или нескольких плоскостях, либо они являются зеркальными отображениями этого шаблона. Сети DeepMind хорошо делают эту работу. Не каждый человек может похвастаться таким же результатом.

Человеческая способность представлять такого рода вещи, а также выяснять, что может находиться за зрительным препятствием, и объясняет, почему мы можем так хорошо ориентироваться в условиях сложной среды. Умения такого уровня никогда еще не были доступны роботам.

Теги: DeepMind, Alphabet, ИИ

Комментарии

(0) Добавить комментарий

Ищите команду разработчиков? Не можете найти робота для своих нужд? Пишите нам!

Для обратной связи укажите ваш E-mail, он будет доступен только администратору. Так вы сможете оперативно узнать, когда ответ на ваш вопрос будет опубликован



Новые комментарии

Перспективы производства промышленных роботов в России
Мария
28.08.2024
08:13:38
Здраствуйте - можно ли узнать по поводу ультразвуковых датчиков мне для протезирования руки
Бесплатная мастерская для школьников и студентов
Гость
01.08.2024
06:19:40
Хорошая инициатива!