Генератор 3D-моделей на базе ИИ
В моей повседневной работе 3D-художника я использую ИИ для генерации 3D-моделей из текста, чтобы быстро создавать прототипы концепций, фоновые объекты и исследовать варианты дизайна, что вручную заняло бы часы. Основной процесс включает интерпретацию текстового промта ИИ для генерации черновой геометрии, которую я затем дорабатываю до готового к производству актива. Это руководство предназначено для художников, разработчиков игр и дизайнеров, которые хотят эффективно интегрировать этот мощный инструмент в свой рабочий процесс, понимая как его непосредственную полезность, так и текущие ограничения. Я проведу вас через мой практический процесс от промта до финальной модели.
Основные выводы:
ИИ не «воображает» в человеческом смысле. Он работает, сопоставляя свои тренировочные данные с обширными наборами 3D-моделей и их текстовых описаний. Когда вы вводите «деревенский деревянный табурет», он статистически реконструирует 3D-форму, которая лучше всего соответствует геометрическим и стилистическим паттернам, связанным с этими словами. Я обнаружил, что он интерпретирует связи между формами и семантическими метками. Он понимает, что «табурет» часто коррелирует с сиденьем, ножками и, возможно, перекладиной, но точные пропорции, стиль и качество сетки могут варьироваться.
Я никогда не ожидаю идеальной модели с первой попытки. Моя первоначальная генерация — это разведывательная миссия. Я начинаю с простого, четкого промта, чтобы установить базовый уровень. Например, «научно-фантастический шлем» вместо «эпический кибернетический шлем для космического десантника». Я сразу же проверяю результат на предмет распознавания основной формы и крупных артефактов. В Tripo я сгенерирую несколько быстрых вариаций из этого простого промта, чтобы увидеть стандартную интерпретацию ИИ, прежде чем добавлять сложность. Этот первый проход показывает мне, есть ли у ИИ сильная базовая концепция для моего объекта.
Наиболее частые проблемы — это слитная геометрия (где отдельные части, такие как ножки стула, сливаются в сплошной блок), топологический шум (бугристая, неровная поверхность) и неправильная интерпретация масштаба. Я избегаю их, избегая излишне сложных промтов на начальном этапе. Если я получаю слитную геометрию, я упрощаю описание или разбиваю объект на компоненты в последующих промтах. Что касается топологического шума, который почти гарантирован, я с самого начала планирую ретопологию в постобработке — я рассматриваю необработанный результат как скульптуру, а не как финальную сетку.
Эффективный промт состоит из трех частей: Субъект, Стиль и Контекст. «Плетеная корзина для пикника (Субъект) с откидной крышкой, низкополигональный, стилизованный мультфильм (Стиль), изолирована на белом фоне (Контекст)». Фраза контекста удивительно важна; она помогает ИИ генерировать чистую, сфокусированную модель без окружающего беспорядка. Я всегда указываю художественный стиль (реалистичный, глиняный, низкополигональный, аниме) и часто добавляю усилитель качества, например «высокодетализированный» или «чистая топология», хотя интерпретация ИИ «чистой топологии» будет отличаться от человеческого моделировщика.
Мой метод — аддитивный. Я начинаю с основного объекта и наблюдаю результат. Затем я добавляю детали.
"Фантастический щит.""Круглый фантастический щит с эмблемой дракона, низкополигональный стиль.""Круглый деревянный фантастический щит с рельефной металлической эмблемой дракона, низкополигональный, готовый для игры, вид спереди."
Этот пошаговый подход позволяет выделить, что добавляет каждый описательный кластер, и обеспечивает контролируемую доработку.Различные инструменты для 3D-моделирования на базе ИИ имеют разные стилистические сильные стороны и предубеждения в обучении. Один может преуспевать в органических формах, другой — в твердых поверхностях. Я регулярно тестирую один и тот же промт на нескольких платформах. Я веду простой журнал: для промта, например, «лампа в стиле ар-деко», я отмечаю, какой инструмент дал лучший силуэт, какой лучше всего передал детали поверхности и какой имел наименьшее количество крупных артефактов. Речь идет не о поиске «лучшего» инструмента, а о знании того, какой инструмент лучше всего подходит для конкретного типа актива в моем текущем проекте.
Ни одна модель, сгенерированная ИИ, не готова к использованию в сцене «как есть». Мой первый шаг всегда — импорт OBJ или GLB в стандартный 3D-пакет, такой как Blender. Мой первоначальный контрольный список очистки:
Это самый критичный шаг. Топология, сгенерированная ИИ, — это беспорядок: она не является многообразной, не основана на квадах и непригодна для анимации или эффективного рендеринга. Я использую инструменты автоматической ретопологии (такие как QuadriFlow в Blender или внешние аддоны) для создания чистой, преимущественно квад-сетки с хорошим потоком ребер. Затем я разворачиваю UV-координаты. UV-координаты, сгенерированные ИИ, если они вообще существуют, обычно непригодны для использования. Я создаю новые, эффективные UV-карты, прежде чем даже думать о текстурировании. Только после этого актив становится технически жизнеспособным.
Актив, сгенерированный ИИ, теперь представляет собой чистую сетку с UV-координатами. Отсюда он попадает в мой стандартный пайплайн. Я запекаю детали с высокополигональной оригинальной сетки ИИ на карту нормалей новой низкополигональной сетки. Затем я текстурирую ее в Substance Painter или с помощью инструментов для текстурирования на базе ИИ, используя запеченные карты в качестве основы. Наконец, я настраиваю правильный масштаб сцены, точку поворота и применяю необходимые LOD (уровни детализации). В Tripo, если я использую его интегрированный пакет, я могу выполнить шаги ретопологии и текстурирования в той же среде, чтобы упростить процесс.
Генерация ИИ не заменяет традиционное моделирование. Это другой инструмент. Я использую традиционное моделирование по кубам/сабдивам для ключевых персонажей, сложных механических деталей или любых активов, требующих точной, контролируемой топологии для деформации. Я использую генерацию ИИ для быстрого прототипирования, создания большого объема уникальных, но простых фоновых активов (камни, ящики, варианты мебели) и для мозгового штурма форм. Это фантастический инструмент для преодоления проблемы «чистого листа» в начале проекта.
Мое дерево решений простое:
Быстрая эволюция захватывает. Тенденции, на которых я больше всего сосредоточен, — это улучшенный топологический вывод (меньше очистки), последовательная генерация с нескольких ракурсов (создание поворотного стола модели из одного промта) и прямая генерация UV-координат и текстур. Святым Граалем для моего рабочего процесса был бы ИИ, который мог бы выводить чистую, квад-сетку с разумными UV-швами из сложного промта. Мы еще не достигли этого, но прогресс за последний год убеждает меня, что это вопрос «когда», а не «если». Мой совет — изучите текущие рабочие процессы сейчас, чтобы вы могли бесшовно интегрировать эти достижения по мере их появления.
moving at the speed of creativity, achieving the depths of imagination.
Текст и изображения в 3D-модели
Бесплатные кредиты ежемесячно
Максимальная детализация