Реалистичный генератор AI 3D-моделей
В моей повседневной работе с AI 3D-генерацией я постоянно сталкиваюсь с тем, что отражающие материалы, такие как хром, полированный металл и стекло, являются наиболее частыми причинами сбоев. Основная проблема заключается в том, что модели ИИ обучаются на 2D-изображениях, где отражение — это просто набор пикселей, а не физическое взаимодействие с окружающей средой. Это приводит к тому, что модели имеют запеченные, некорректные «текстуры» вместо истинных отражающих свойств. Эта статья предназначена для 3D-художников и разработчиков, использующих AI-генерацию, которым нужны практические стратегии для преодоления этой конкретной проблемы с материалами, что позволит сэкономить часы разочарования от пост-обработки.
Основные выводы:
Фундаментальное ограничение проистекает из обучающих данных. AI 3D-генераторы в основном обучаются на обширных наборах данных, состоящих из пар 2D-изображение-3D-модель. Когда ИИ видит фотографию хромированного шара, он учится ассоциировать эту форму с определенным расположением искаженных цветов и бликов. Он не изучает основной принцип, согласно которому хромированная поверхность отражает свое окружение. То, что он выдает, — это диффузный или глянцевый материал с нарисованной на нем картой отражения. Это запеченное отражение будет выглядеть правильно только с одного угла — угла, аналогичного обучающим данным — и полностью сломается при изменении камеры или освещения.
При генерации отражающих объектов я научился немедленно искать конкретные признаки. Наиболее частым является «эффект размазывания», когда блики растягиваются или размываются нефизическим образом по кривизне поверхности. Другой — детали «фантомной среды» — случайные цветовые пятна или формы, которые выглядят как искаженная комната или небо, но не имеют смысла при осмотре. Вы также можете получить непоследовательный бликовый отклик, когда одна часть модели выглядит блестящей, а другая матовой, несмотря на то, что запрос указывает на однородный материал, такой как «полированная сталь».
Это не простая ошибка; это структурная проблема. Истинное отражение — это зависящий от точки обзора, вычисляемый в реальном времени расчет, основанный на 3D-среде. Современные генеративные модели ИИ не являются 3D-движками рендеринга; они являются предсказателями паттернов, создающими статическую 3D-геометрию и текстуры. Обучение их истинной отражательной способности потребует обучения не только на парах форма-текстура, но и на полных определениях материалов (таких как карты шероховатости/металличности PBR) и их взаимодействии с бесконечным количеством возможных световых сред. Мы просим машину, работающую с 2D-паттернами, понять основную концепцию 3D-рендеринга, поэтому прогресс здесь медленнее, чем в генерации форм.
Вы не сможете решить проблему отражения при генерации, но вы можете свести ее к минимуму. Я избегаю подсказок типа «зеркальная отделка» или «сильно отражающий». Вместо этого я использую термины, описывающие визуальный результат с одной четкой точки зрения. Например: «Боковое зеркало винтажного автомобиля, с ярким, четким бликом, центрированным на его выпуклой поверхности, на мягком сером фоне.» Это направляет ИИ к правильному пиксельному паттерну. Для ввода изображений я использую чистые, освещенные спереди фотографии продуктов, где отражения минимальны. Эталонное изображение хромированного объекта в сложной среде — это рецепт катастрофы, так как ИИ будет пытаться смоделировать искаженную среду на объекте.
Каждая сгенерированная ИИ отражающая модель нуждается в очистке. Мой первый шаг всегда — удаление сгенерированной текстуры. Я импортирую модель в 3D-пакет (например, Blender) и заменяю сгенерированный ИИ материал чистым, процедурным PBR-материалом. Я устанавливаю очень низкую шероховатость (например, 0.1) и металличность на 1. Это немедленно дает мне «истинную» отражающую поверхность, хотя и простую. Следующий шаг — коррекция геометрии: использование сглаженного, отражающего материала для выявления дефектов сетки, которые я не мог видеть раньше, и их исправление с помощью стандартных инструментов ретопологии и скульптинга.
Именно здесь интеллектуальные инструменты меняют правила игры. В Tripo я использую функцию автоматической сегментации, чтобы изолировать только проблемную отражающую часть модели — например, хромированный бампер на автомобиле или стеклянную линзу на камере. Вместо повторной генерации всей сложной модели я могу сосредоточить подсказки или закрасить только эту сегментированную часть, или легко удалить и заменить ее материал в своем 3D-программном обеспечении. Этот хирургический подход гораздо эффективнее, чем рассматривать модель как единый, монолитный блок. Он превращает проблему отражения из проблемы «начать сначала» в локализованное исправление.
Вот мой практический контрольный список для простого объекта, такого как хромированный тостер:
Мое эмпирическое правило:
moving at the speed of creativity, achieving the depths of imagination.
Текст и изображения в 3D-модели
Бесплатные кредиты ежемесячно
Максимальная детализация