Люди совершенно не испытывают затруднений при рассматривании фотоснимков и сопоставлении двухмерных представлений с реальными трехмерными объектами. Но для компьютеров, обладающих не столь богатым опытом жизни в реальном мире, решение подобной задачи связано с множеством сложностей. Однако недавно группа исследователей создала новый алгоритм "развертки", использование которого значительно упрощает процесс распознавания образов на фотоснимках. Этот алгоритм прошел предварительное обучение на ряде примеров трехмерных объектов и их разверток на двухмерной плоскости, а его нормальная работа заключается в выполнении обратного преобразования.
После процесса предварительного обучения нейронной сети алгоритм научился полностью самостоятельно преобразовывать снимки трехмерных объектов, самолетов различных типов, к примеру, в набор двухмерных поверхностей, которые могут быть "сшиты" обратно в трехмерную форму. И такой подход успешно работает по отношению к изображениям различных объектов, самолетов, автомобилей и тел людей. Отметим, что предыдущий вариант этого алгоритма во время своей работы допускал множество ошибок, из снимков самолетов он иногда производил трехмерные модели птиц, а автомобили-седаны трансформировались "чудесным" образом в хэтчбеки.
Программа SurfNet (от слова "surface") была представлена на конференции IEEE по компьютерному видению и распознаванию объектов (Institute of Electrical and Electronics Engineers Conference on Computer Vision and Pattern Recognition), которая проходила на прошлой неделе в Гонолулу. А алгоритмы, лежащие в основе этой программы могут быть использованы в практических целях для создания систем виртуальной и дополненной реальности, для составления трехмерных карт окружающего пространства и помещений, в которых предстоит действовать роботам, в новых компьютерных интерфейсах, где управление осуществляется при помощи движений и жестов рук, и во многих других областях.
Ключевые слова:
Нейронная,
Сеть,
Искусственный,
Интеллект,
Обучение,
Снимок,
Изображение,
Развертка,
Трехмерный,
Объект
Первоисточник
Другие новости по теме:
Создан первый самообучающийся алгоритм распознавания объектов на фото и видеоИсследователи и программисты создали самую точную на сегодняшний день цифровую модель человеческого лица.Это - первая "скульптура", созданная искусственным интеллектом и распечатанная на трехмерном принтереСоздана компьютерная нейронная сеть, возможности которой сравнимы с возможностями приматов в области распознавания визуальных образовОбучение искусственного интеллекта людьми дает лучшие результаты, чем его самостоятельное самообучение