Исследователи из Университета Калифорнии в Сан-Диего (UCSD) разработали систему распознавания пешеходов, которая, по утверждению разработчиков, действует практически в режиме реального времени с повышенной точностью, в сравнении с существующими системами. Исследователи считают, что данная технология может быть использована в робототехнике, автономном транспорте и в поисковых системах на основе изображения и видео.
Система была разработана под руководством профессора электротехники Нуно Васконселоса из UCSD. Его команда объединила традиционные системы машинного зрения с новой технологией глубинного обучения для повышения точности и скорости распознавания.
Цель состояла в разработке видео системы распознавания в режиме реального времени, которая позволит опознавать и классифицировать объекты, особенно людей, в условиях обычного городского транспортного потока. Это позволит беспилотным автомобилям, роботам доставки или низко-летающим дронам обнаруживать пешеходов с тем, чтобы избежать столкновений и создания заторов на трассах.
Большинство систем обнаружения пешеходов делит видимое изображение на отдельные зоны (так называемые «окна»), которые обрабатываются и программно классифицируются для определения присутствия в них человеческих фигур. Это может представлять сложную задачу для разработчиков, поскольку люди бывают разных форм и роста, а на расстоянии меняется перспектива и размер объектов. В типичных условиях реального времени это предполагает обработку миллионов таких окон при частоте видео в 5-30 кадров в секунду.
Созданная в UCSD технология распознавания реализует те же самые основные функции, но делает это поэтапно, а не одним махом. Этот алгоритм позволяет быстро отбрасывать кадры, которые, по всей видимости, не содержат человеческих фигур и сконцентрироваться на тех, где они есть. Так что кадры, которые имеют относительно однородные формы и цвета (например, небо) игнорируются в пользу заполненных кадров.
На втором этапе классифицируются и отбрасываются те кадры, которые содержат объекты, похожие по форме или цвету на человека, но не являются пешеходами (деревья, кустарники другие транспортные средства). На заключительной стадии классификации проводится все большая и большая детализация, пока не останутся и будут помечены только пешеходы. Хотя все эти заключительные расчеты и процессы являются ресурсоемкими, лишь несколько из них относятся к обязательным, так что все это делается быстро.
Целью последующей работы является алгоритм постоянного компромисса между точностью и скоростью. Сейчас алгоритм работает только в задачах бинарного (да/нет) обнаружения, но команда UCSD надеется расширить его возможности для обнаружения нескольких типов объектов одновременно.
Комментарии
(0) Добавить комментарий