Результаты прежних экспериментов Google с алгоритмом RAISR свидетельствуют о повышении детальности и резкости изображения, а новое сообщение от исследовательской группы Google Brain показывает, как алгоритмы машинного обучения способны обеспечить качественно новый уровень видеообработки.
Если алгоритмы RAISR способствуют повышению четкости изображения на фотографиях уже приличного качества, то новый Pixel Recursive Super Resolution показывает, как в результате преобразований может быть получен образ из крошечного, ни на что не похожего блочного массива в разрешении 8x8, который обретает более детальные очертания уже в формате 32x32 пикселя.
Первоначально требуется провести анализ множества похожих фотографий в высоком разрешении. В данном случае, это урезанные фото знаменитостей. Компьютер быстро понижает разрешение этих кадров до блочного формата с низким разрешением. А когда пытается повысить разрешение изображения, процесс выполняется в обратном порядке.
По фото лица знаменитости, например, алгоритм знает, где примерно найти глаза, нос, рот, волосы и подбородок. Зная их расположение, он может просмотреть свою обширную базу данных по фотографиям, чтобы определить, какие пиксельные структуры обычно сюда подходят, и оценить как фото, возможно, должно выглядеть в высоком разрешении.
Такой подход во многом объясняет откровенно неудачные примеры работы алгоритма. Большинство из получающихся результатов довольно комичны.
Несмотря на это, метод показал достойную способность обманывать людей, так как около 10% изображений знаменитостей были восприняты, как сделанные фотокамерой. Еще лучшими оказались результаты изображений без сложностей человеческого лица. Около 28% людей посчитали настоящими фотографиями изображения интерьеров спальни.
Однако очевидно, что это очень ограниченная технология. Можно представить, что в конечном итоге может получиться, идентифицируя людей по кадрам камер видеонаблюдения.
Комментарии
(0) Добавить комментарий