Point-E - система искусственного интеллекта от OpenAI, способная создавать 3D-изображения по текстовому описанию
Группа исследователей, входящая в состав консорциума OpenAI, объявила о создании новой системы искусственного интеллекта под названием Point-E, которая способна генерировать трехмерные изображения объектов по их краткому текстовому описанию. Отметим, что в настоящий момент времени система Point-E является не единственной в своем роде, в течение прошлого и текущего года несколько других групп объявили о создании систем, генерирующих 3D-изображения по описаниям типа "синий стул, стоящий на красном полу" или "мальчик в зеленой кепке, едущий на фиолетовом велосипеде".
Все подобные системы обычно состоят из двух частей. Первая часть получает текстовое описание и пытается понять его смысл. После этого вторая часть, прошедшая обучение через поиск в Интернете, создает желаемое изображение. Такая кажущаяся простота, однако, требует огромных затрат вычислительных ресурсов, а получения результатов можно ожидать от нескольких часов до дней. К примеру, система Google DreamFusion, использующая большое количество графических процессоров, выдает результаты через несколько часов.
Системе же Point-E требуется всего один графический процессор, и она способна выдавать результаты уже через пару минут после получения задания. Однако, здесь имеются нюансы, система не создает изображение в прямом смысле, она генерирует так называемые "облака пикселей", форма которых соответствует форме желаемых объектов. Сгенерированные облака передаются второй части системы, которая объединяет их и создает конечную 3D-модель объекта.
Конечно, визуальное качество результатов работы Point-E хромает, и достаточно сильно по сравнению с результатами работы других систем. Однако, это с лихвой окупается высокой скоростью работы системы, а результаты могут быть вполне использованы для изготовления реальных объектов при помощи 3D-принтера.
И в заключении следует отметить, что система Point-E является системой с открытым исходным кодом, и любой, кто желает попробовать работать с ней, может получить код из репозитория GitHub.