DeepMind добивается серьезного прогресса в области компьютерного зрения

Исследователи из компании DeepMind, являющейся сегодня частью Alphabet (одного из подразделений Google) представили детальное описание метода, который, как они говорят, поможет создать 3-х мерные изображения из нескольких 2-х мерных снимков.

До сих пор подобный метод, основанный на использовании глубоких нейронных сетей, был ограничен виртуальной средой. Естественные условия по-прежнему слишком сложны для обработки с использованием имеющихся алгоритмов и аппаратных средств.

Новый метод может быть полезен для любой системы видеонаблюдения, которая должна реконструировать преступление по нескольким снимкам. Беспилотные автомобили и бытовые роботы также смогут воспользоваться новой технологией одними из первых.

Исследователи приводят пример, когда рука робота может абстрактно рассматриваться в качестве простого сочленения с несколькими суставами, которые затем рассчитываются с использованием данных о форме, цвете и так далее.

Манипулируя первоначально этой абстракцией и заполняя впоследствии ее деталями, подобный метод сможет работать намного быстрее, чем системы рендеринга, которые пытаются манипулировать огромными наборами из 3-х мерных, связанных друг с другом точек.

Процесс мышления во многом можно отнести к чистому восприятию, которое для компьютеров является более сложным, чем для человека. Существует стандартный психологический тест на способности человека мысленно вращать объекты, которые используют геометрические фигуры, известные как объекты Шепарда-Мецлера. В видео, предоставленном DeepMind, нейронные сети классифицируют эти объекты в одном из двух видов: либо они являются версиями шаблона, который был повернут на одной или нескольких плоскостях, либо они являются зеркальными отображениями этого шаблона. Сети DeepMind хорошо делают эту работу. Не каждый человек может похвастаться таким же результатом.

Человеческая способность представлять такого рода вещи, а также выяснять, что может находиться за зрительным препятствием, и объясняет, почему мы можем так хорошо ориентироваться в условиях сложной среды. Умения такого уровня никогда еще не были доступны роботам.

Теги: DeepMind, Alphabet, ИИ

Just AI и «Поток Рекрутмент» запускают AI-рекрутера для автоматизации скрининга резюме и обзвона кандидатов

Новости робототехники

DeepMind добивается серьезного прогресса в области компьютерного зрения

Комментарии

Ищите команду разработчиков? Не можете найти робота для своих нужд? Пишите нам!

Новые комментарии

Другие статьи по теме

Категории