Продвинутый инструмент для 3D-моделирования с ИИ
Я сгенерировал сотни 3D-моделей из одиночных фотографий с использованием ИИ, и окклюзия — проблема отсутствия данных для скрытых поверхностей — является самым большим препятствием на пути к получению готовых к производству результатов. Это руководство предназначено для художников и разработчиков, которым нужны пригодные для использования 3D-активы быстро, и кто разочарован дырами, искаженной геометрией и плоскими задними сторонами, которые часто создает ИИ. Я объясню, почему это происходит с практической точки зрения, и подробно опишу свой проверенный, практический рабочий процесс для смягчения этих проблем, от выбора правильного входного изображения до постобработки сгенерированной сетки. Цель состоит не в совершенстве с одного клика, а в систематическом подходе, который позволит вам достичь 90% результата за считанные минуты.
Основные выводы:
Из одной фотографии ИИ имеет только 2D-информацию о пикселях и должен вывести полный 3D-объем. Это фундаментально некорректная задача. У системы нет фотометрических или геометрических данных для задней, нижней или окклюдированных частей объекта. В своей работе я рассматриваю это не как отказ ИИ, а как ограничение входных данных. Модель делает свое «лучшее предположение» на основе паттернов, полученных из тысяч 3D-примеров, но без явных данных это предположение всегда будет интерполяцией или усредненным значением.
Эти обоснованные предположения проявляются предсказуемым образом. Наиболее частые проблемы, которые я исправляю, — это полые или полностью отсутствующие задние стороны, где модель просто создает плоскую или вогнутую оболочку. Искаженная или расплавленная геометрия возникает в окклюдированных областях, таких как пространство между рукой и туловищем персонажа, где ИИ неправильно смешивает поверхности. Вы также увидите растяжение или размытие текстур на выведенных поверхностях, поскольку у системы нет визуальной ссылки для проецирования.
Наш человеческий мозг использует многолетний контекстуальный, физический и эмпирический опыт, чтобы мысленно завершить объект. ИИ, такой как движок генерации Tripo, использует статистические априорные данные из своего обучающего набора данных. Он не «знает», что у стула четыре ножки; он знает, что в большинстве 3D-моделей, помеченных как «стул», определенный пиксельный шаблон на фотографии с видом спереди коррелирует с геометрией ножки в объеме. Это различие имеет решающее значение: вывод ИИ является чисто корреляционным, а не когнитивным, поэтому он может потерпеть неудачу на новых или асимметричных объектах.
Я трачу здесь больше времени, чем где-либо еще. Хорошее исходное изображение решает половину проблемы.
Когда я генерирую модель в Tripo, я не просто нажимаю «создать». Я использую текстовую подсказку, чтобы закрепить вывод ИИ. Для фотографии винтажной камеры моя подсказка была бы не просто «камера». Я бы использовал «профессиональная пленочная камера, цилиндрический объектив, текстурированная рукоятка, сплошная задняя часть». Это направляет статистическую априорную информацию к более полной, конкретной форме.
Я также уделяю пристальное внимание любым ползункам детализации или сложности. Слишком сильное их повышение на одном изображении может привести к тому, что ИИ будет «галлюцинировать» чрезмерную, плохо сформированную геометрию в окклюдированных областях. Я начинаю с умеренных настроек и итеративно их корректирую.
Ни одна одноракурсная модель не идеальна с первого раза. Мой первый шаг всегда — осмотр сетки в средстве просмотра платформы, вращая ее, чтобы выявить основные дыры или бессмысленную геометрию.
Мой контрольный список для любой фотографии, которую я планирую преобразовать:
Я отношусь к платформе ИИ как к инструменту для совместной работы. В Tripo, например, я в значительной степени полагаюсь на интеллектуальную сегментацию после генерации. Автоматически разделяя различные группы материалов или части объекта, она часто выявляет, где логика окклюзии дала сбой между компонентами, давая мне более чистую отправную точку для исправлений, чем одна, грязная сетка.
Я никогда не предполагаю, что первый результат является окончательным. Мой цикл проверки прост:
Для небольших отверстий или незначительных искажений быстрые исправления всегда быстрее. Использование кисти для заполнения или сглаживания непосредственно на сгенерированной ИИ сетке эффективно. Однако, когда ИИ полностью изобрел структурно ненадежную или причудливую геометрию для окклюдированной области (например, скрученный беспорядок для задней части сложной механической детали), быстрее удалить этот участок и вручную реконструировать его с использованием примитивов и инструментов для мостовидных соединений. Признание этого порога является ключевым навыком.
Это золотая середина для постобработки. Автоматическая ретопология преобразует часто плотную, нерегулярную сетку ИИ в чистую, готовую к анимации четырехгранную сетку. Этот процесс сам по себе может упорядочить и исправить незначительные артефакты окклюзии. Сегментация еще более мощна для окклюзии; разделяя модель на логические части, вы часто можете увидеть, что «окклюзия» — это просто две части, слитые воедино. Исправлять их по отдельности намного проще.
Если мой одноракурсный результат после двух итераций все еще имеет критические недостатки, и мне нужен высококачественный актив, я меняю стратегию. Иногда я генерирую вторую модель из другого изображения того же объекта, сгенерированного ИИ (например, вид сзади, синтезированный ИИ для изображений). Затем я объединяю две модели. Для наивысшей точности наиболее надежным решением является использование специализированного многоракурсного конвейера генерации платформы с самого начала, если он доступен. Он использует несколько фотографий (или синтетически сгенерированных видов) в качестве входных данных, предоставляя ИИ геометрические данные, которых ему не хватает в одном снимке, эффективно решая проблему окклюзии на источнике.
moving at the speed of creativity, achieving the depths of imagination.
Текст и изображения в 3D-модели
Бесплатные кредиты ежемесячно
Максимальная детализация