안녕하세요, Lyson입니다!
지난 한 해 동안 GenAI (생성형 AI) 분야는 빠르게 성장했습니다. 올해 초 저는 빌리빌리(Bilibili)에서 Midjourney 튜토리얼을 체계적으로 진행했으며, 오늘날 AI 생성 3D 모델 기술은 점점 더 성숙해지고 있습니다. 학습 곡선이 낮아지면서 3D 기술을 더 빨리 익힐 수 있게 되어, 모든 사람이 3D 창작의 즐거움을 경험할 수 있게 되었습니다.
최근 실험에서 저는 Tripo AI의 흥미로운 세계에 뛰어들어 Blender 및 Magnific AI와 결합했습니다. 그 결과는? 아래의 멋진 이미지를 감상해 보세요:
Tripo AI를 처음 접했을 때, Midjourney V3 모델을 처음 사용했을 때 느꼈던 즐거움이 되살아났습니다. 3D 생성 기술과 얽힌 또 다른 이야기는 모션 캡처 기술의 발전입니다. 과거에는 고정밀 모션 파일을 얻기 위해 값비싼 장비가 필요했지만, 오늘날에는 스마트폰만 있으면 충분합니다.
많은 분들이 3D 모델링 학습에 필요한 시간 투자에 대해 궁금해하셨을 것입니다. 상당한 시간이죠! 만약 AI가 모델을 직접 생성하여 100%는 물론 80%만 완성해 준다고 해도 엄청난 이득이 될 것입니다. 특히 반복적인 '벽돌 쌓기' 같은 작업에서 많은 시간을 절약할 수 있습니다. 이것이 Tripo AI가 저를 설레게 하는 이유 중 하나입니다!
Tripo AI를 처음 사용하던 날, 저는 Tripo AI의 성능 한계를 시험하기 위해 수백 개의 모델을 일괄 처리하는 Python 스크립트를 작성했습니다. 모두가 알다시피, 텍스트 생성에서 프롬프트의 중요성은 특히 빠른 도구 개발 단계에서 매우 중요합니다. 어떤 프롬프트가 효율적으로 작동하는지 이해하면 창작 과정에서 귀중한 시간을 절약할 수 있습니다.
실험을 통해 저는 간단한 형용사부터 텍스처 재료, 색상 광택, 그리고 "Masterpiece"와 같은 프롬프트 시작 문구에 이르기까지 다양한 필드 속성을 점진적으로 탐색했습니다.
제가 발견한 몇 가지 핵심 기술과 결론은 다음과 같습니다:
이제 예시를 통해 이러한 통찰력을 분석하고, 여러분의 이해를 높이고 3D 창작물을 향상시킬 수 있는 미묘한 차이들을 풀어보겠습니다.
Prompt: Cyberpunk mask, Compact, digital, Futuristic design, Voice modulator, Air filtration system, Quick-release mechanism, Concealed weapon storage, Biometric locking, Textured solar panel, moderate brightness, functional reflectivity, Sophisticated models, Smooth LOD transitions, gradient detail levels
위 프롬프트에서, 다소 추상적인 특정 디자인 요소를 제외하고, 모델은 프롬프트의 다른 부분, 특히 P4를 잘 이해하고 있음을 보여줍니다. 하지만 이것이 더 긴 프롬프트가 더 가치 있다는 것을 의미할까요? 프롬프트를 자세히 살펴보면, 실제로 주요 주제(마스크), 가장 두드러지는 설명 수식어(사이버펑크, 미래 지향적), 그리고 시작 문구(부드러운 LOD 전환, 그라디언트 디테일 레벨)만이 상당한 비중을 차지한다는 것을 알 수 있습니다. 이제 커뮤니티의 관련 예시들을 비교하며 계속 진행해 보겠습니다:
Prompt: a futuristic hardsurface helmet in green marble, high resolution
이 예시에서 프롬프트는 단 한 문장이지만, 제가 언급한 "주요 주제 + 가장 두드러지는 형용사 1~3개 + 시작 문구" 공식을 완전히 통합했기 때문에 높은 정밀도와 매끄러운 표면의 인상을 만들어냅니다.
이제 다른 예시를 살펴보겠습니다:
Prompt: Cybernetic heart, display, Lifesaving, mechanical, High-definition screen, Laser-cut steel, Modular seat configuration, Anti-graffiti coating, Shimmering sequin texture, bright appearance, sparkling reflectivity, Realistic fluid dynamics simulation, Precision surface smoothing, artifact-free curvature
이 예시에서 P3의 사이버네틱 심장과 P4의 미래형 디스플레이 화면은 프롬프트의 의도와 잘 일치합니다. 긴 프롬프트의 구조를 살펴보면, 우리가 너무 많은 상세한 형용사로 객체를 묘사하려고 시도하지 않았음을 알 수 있습니다. 따라서 주요 주제를 제외하고 대부분은 "masterpiece" 또는 "4k"와 같은 시작 문구의 범주에 속합니다.
하지만 3D에서는 더 나은 결과를 얻기 위해 몇 가지 새로운 프롬프트를 기억해야 합니다. 예를 들어: 반짝이는 시퀀스 텍스처, 밝은 외관, 반짝이는 반사율, 사실적인 유체 역학 시뮬레이션, 정밀한 표면 평활화, 아티팩트 없는 곡률. 시작 문구에 재료, 반사 효과 및 곡률에 대한 많은 설명이 포함되어 있음을 눈치챘을 것입니다. 따라서 시작 문구를 AI 출력에 크게 영향을 미칠 수 있는 이러한 '3D 특성'으로 생각할 수도 있습니다.
자세히 살펴보면, 이 프롬프트는 사이버네틱 심장과 디스플레이라는 두 개의 평행한 주제를 가지고 있는 것처럼 보입니다. Stable Diffusion의 경우, 이러한 프롬프트는 흐릿한 결과물을 생성하거나 두 요소가 하나의 이미지에 나타나 이미지에 논리적인 문제를 야기할 수 있습니다.
하지만 Tripo AI 실험에서 저는 모델이 하나의 객체를 그리는 데 집중하는 경향이 있음을 발견했습니다. 따라서 프롬프트에 두 개의 객체가 포함되어 있다면, 이미지 1은 객체 A로만 구성되고 이미지 2는 객체 B로만 완전히 생성되는 것을 볼 수 있습니다.
이는 AI 제품 개발의 현재 단계에 대한 통찰력을 제공하며, 3D 작업 흐름과의 연관성을 시사합니다: 한 번에 하나의 항목을 생성하는 데 집중하세요.
Prompt 1:Sci-fi bench, Durable, rugged, Flush installation, Anti-slip surface, Illuminated edges, Slick oil surface texture, variable brightness, high reflectivity, Seamless 3D integration, Harmonious light mapping, balanced illumination
Prompt 2:Sci-fi bench, Miniaturized, interactive, Flush installation, Anti-slip surface, Illuminated edges, Boosted motors, Grip tape detailing, Customizable wheels, Abrasive sandpaper texture, low brightness, non-reflective, Procedural generation techniques, Seamless mesh, unified surfaces
특히 첫 번째 이미지의 의자와 두 번째 이미지의 P2, P3 의자를 재료 특성에 초점을 맞춰 비교하는 것이 주목할 만합니다. 반사 특성에 대한 설명은 생성된 결과에 상당한 영향을 미치며, 이는 여러 번의 시도에서 일관되게 효과적이었습니다. 지면 제약상 모든 예시를 여기에 표시하지는 않겠습니다.
이어서, 3D 모델링에 익숙하다면 모델 생성 과정에서 '대칭'의 중요성을 아실 겁니다. 따라서 필요하다면 AI에게 '대칭'에 특별히 집중하도록 명확히 알려주는 것을 잊지 마세요.
Prompt:Security turret, Tactical, time-telling, 360-degree surveillance, Automated targeting, Infrared vision, Augmented vision, Prescription compatibility, Lightweight frame, Composite fiber paneling, moderate brightness, reduced reflectivity, Immersive world-building, Intentional reflective design, deliberate symmetry
물론, 이 이미지와 같이 이미지-투-3D 기능을 사용할 수도 있습니다. Tripo AI를 사용할 때 'Image to 3D'를 선택하고 이미지를 업로드한 다음 Draft 버튼을 클릭하기만 하면 됩니다. 시스템은 먼저 이미지에서 피사체를 자동으로 추출한 다음 모델을 생성합니다. 개인적으로 저는 초기 Draft에서 정밀도를 확보하기 위해 Photoshop에서 이미지를 미리 편집(전경 추출)하는 것을 선호하는데, 이는 자동 분할 시 때때로 흐릿하게 나타날 수 있기 때문입니다.
그 후, Refine을 클릭하여 모델의 정밀도를 향상시킵니다. 최종적으로 얻은 모델은 다음과 같습니다. 다운로드를 클릭하면 전문 3D 소프트웨어로 가져와 추가적으로 다듬을 수 있습니다.
다음은 다른 이미지-투-3D 예시입니다:
Tripo AI를 탐색하고 저희 미디어 플랫폼에 참여하세요:
Original Article: https://medium.com/@thegodtripo/ultimate-tripo-ai-guide-i-prompt-tips-and-tricks-for-text-image-to-3d-cd49523b10ae
작성: Lyson(Twitter@lyson_ober), 편집: Oliver
moving at the speed of creativity, achieving the depths of imagination.