사용자 가이드 (I): Tripo AI의 텍스트/이미지-3D 탐색 및 효과적인 프롬프트 작성을 위한 입증된 팁과 트릭

서론

안녕하세요, Lyson입니다!

지난 한 해 동안 GenAI(생성형 AI) 분야는 급격한 성장을 지속했습니다. 올해 초 Bilibili에서 Midjourney 튜토리얼을 체계적으로 진행했으며, 이제 AI 생성 3D 모델 기술은 더욱 성숙해졌습니다. 학습 곡선이 낮아지면서 3D 기술을 더 빠르게 습득할 수 있게 되었고, 모든 사람이 3D 창작의 즐거움을 경험할 수 있게 되었습니다.

잠재력 탐색: Tripo AI + Blender + Magnific AI

최근 실험에서 저는 Tripo AI의 흥미로운 세계에 뛰어들어 Blender 및 Magnific AI와 결합했습니다. 그 결과는요? 아래 멋진 이미지를 감상해 보세요:

Tripo AI를 처음 접했을 때, Midjourney V3 모델을 처음 사용했을 때 느꼈던 즐거움이 다시 떠올랐습니다. 3D 생성 기술과 얽힌 또 다른 이야기는 모션 캡처 기술의 발전입니다. 과거에는 고정밀 모션 파일을 얻으려면 비싼 장비가 필요했지만, 오늘날에는 스마트폰 하나면 충분합니다.

3D 학습의 시간 딜레마

많은 분들이 3D 모델링을 배우는 데 필요한 시간 투자에 대해 궁금해하셨습니다. 상당하죠! 만약 AI가 모델을 직접 생성하여 100%는 물론 80%만 완성해 줘도 엄청난 이득일 것입니다. 특히 반복적이고 '벽돌 쌓기'와 같은 작업에서 많은 시간을 절약할 수 있습니다. 이것이 바로 Tripo AI가 저를 설레게 하는 이유 중 하나입니다!

한계 시험: Tripo AI와 함께한 하루

Tripo AI를 처음 사용한 날, 저는 Python 스크립트를 작성하여 수백 개의 모델을 일괄 처리하며 Tripo AI의 성능 한계를 시험했습니다. 우리 모두 알다시피, 특히 빠른 도구 개발 단계에서 텍스트 생성 시 프롬프트의 중요성은 매우 큽니다. 어떤 프롬프트가 효율적으로 작동하는지 이해하는 것은 창작 과정에서 귀중한 시간을 절약할 수 있습니다.

실험을 통해 저는 간단한 형용사부터 질감 재료, 색상 광택, 그리고 "Masterpiece"와 같은 프롬프트 시작 문구까지 다양한 필드 속성을 점진적으로 탐색했습니다.

공개된 기술과 결론

제가 발견한 몇 가지 핵심 기술과 결론은 다음과 같습니다.

간결성이 핵심: 현재 모델은 주요 주제와 간략한 수식어를 이해하는 데 탁월합니다. 하지만 긴 텍스트는 세부 사항을 크게 향상시키지 않습니다. 주요 주제와 그 특징을 명확하게 표현하는 데 집중하세요.
색상 프롬프트의 힘: 색상 프롬프트는 결과물에 해당 색상이 넓은 영역으로 나타날 때 가장 효과적입니다. 언어만으로 두 가지 이상의 색상을 묘사하는 것은 어려울 수 있으며, 전문 3D 소프트웨어에서 직접 수정하는 것이 워크플로우에 더 잘 맞습니다.
시작 구문의 중요성: 좋은 시작 구문은 질감에서 예상치 못한 개선을 가져올 수 있습니다. 고품질 결과물과 관련된 프롬프트를 기억하고 관찰하며 반복적으로 실험해 보세요.
재질의 중요성: 재질 묘사가 광원 묘사보다 우선합니다. 재질의 반사율에 대한 모델의 이해도는 정확하며 주목할 만합니다.
"다중 머리 문제": 모델은 첫 번째 Draft 단계에서 좋은 디테일을 생성하는 데 탁월하며, 두 번째 Refine 단계에서 "다중 머리 문제"가 발생할 가능성이 있지만, 3D 워크플로우 내에서 쉽게 해결할 수 있습니다.

완벽한 프롬프트 작성: 이해를 심화시키는 예시

이제 예시를 통해 이러한 통찰력을 분석하고, 여러분의 이해를 높이고 3D 창작물을 향상시킬 수 있는 미묘한 차이들을 풀어보겠습니다.

간결성과 시작 구문의 힘: "주요 주제 + 1~3개의 가장 두드러진 형용사 + 시작 구문" 공식:

Prompt: Cyberpunk mask, Compact, digital, Futuristic design, Voice modulator, Air filtration system, Quick-release mechanism, Concealed weapon storage, Biometric locking, Textured solar panel, moderate brightness, functional reflectivity, Sophisticated models, Smooth LOD transitions, gradient detail levels

위에서 언급된 프롬프트에서, 일부 더 추상적인 디자인 요소를 제외하고, 모델은 프롬프트의 다른 부분, 특히 P4를 잘 이해하고 있음을 보여줍니다. 하지만 이것이 더 긴 프롬프트가 더 가치 있다는 의미일까요? 프롬프트를 자세히 살펴보면, 실제로는 주요 주제(마스크), 가장 두드러진 설명 수식어(cyberpunk, futuristic), 그리고 시작 구문(Smooth LOD transitions, gradient detail levels)만이 상당한 비중을 차지한다는 것을 알 수 있습니다. 이제 커뮤니티의 관련 예시들을 비교하며 계속 진행해 보겠습니다.

Prompt: a futuristic hardsurface helmet in green marble, high resolution

이 예시에서 프롬프트는 단 한 문장이지만, 제가 언급한 "주요 주제 + 1~3개의 가장 두드러진 형용사 + 시작 구문" 공식을 완벽하게 포함하고 있기 때문에, 높은 정밀도와 매끄러운 표면의 인상을 줍니다.

이제 다른 예시를 살펴보겠습니다.

Prompt: Cybernetic heart, display, Lifesaving, mechanical, High-definition screen, Laser-cut steel, Modular seat configuration, Anti-graffiti coating, Shimmering sequin texture, bright appearance, sparkling reflectivity, Realistic fluid dynamics simulation, Precision surface smoothing, artifact-free curvature

이 예시에서 P3의 사이버펑크 전자 심장과 P4의 미래 지향적인 디스플레이 화면은 프롬프트의 의도와 잘 일치합니다. 긴 프롬프트의 구조를 보면, 객체를 너무 많은 상세한 형용사로 묘사하려고 하지 않았다는 것을 알 수 있습니다. 따라서 주요 주제를 제외하고는 대부분 "masterpiece"나 "4k"와 같은 단어와 유사하게 시작 구문 범주에 속합니다.

하지만 3D에서는 더 나은 결과를 얻기 위해 몇 가지 새로운 프롬프트를 기억해야 합니다. 예를 들어: Shimmering sequin texture, bright appearance, sparkling reflectivity, Realistic fluid dynamics simulation, Precision surface smoothing, artifact-free curvature. 시작 구문에 재질, 반사 효과, 곡률에 대한 많은 설명이 포함되어 있다는 것을 눈치채셨을 것입니다. 따라서 시작 구문을 AI 출력에 크게 영향을 미칠 수 있는 이러한 '3D 특성'으로 생각할 수도 있습니다.

한 번에 하나의 항목 생성에 집중:

자세히 살펴보면, 이 프롬프트에는 사이버네틱 심장과 디스플레이라는 두 개의 평행한 주제가 있는 것처럼 보입니다. Stable Diffusion의 경우, 이러한 프롬프트는 흐릿한 결과물이나 두 요소가 하나의 이미지에 나타나 이미지에 논리적 문제를 야기할 수 있습니다.

하지만 Tripo AI 실험에서 저는 모델이 하나의 객체를 그리는 데 집중하는 경향이 있다는 것을 발견했습니다. 따라서 프롬프트에 두 개의 객체가 포함되어 있다면, 이미지 1은 객체 A만으로 구성되고, 이미지 2는 객체 B로 완전히 생성될 수 있습니다.

이는 AI 제품 개발의 현재 단계에 대한 통찰력을 제공하며, 3D 워크플로우와의 연결성을 시사합니다: 한 번에 하나의 항목을 생성하는 데 집중하세요.

재질 및 대칭 관련 고려 사항:

Prompt 1:Sci-fi bench, Durable, rugged, Flush installation, Anti-slip surface, Illuminated edges, Slick oil surface texture, variable brightness, high reflectivity, Seamless 3D integration, Harmonious light mapping, balanced illumination

Prompt 2:Sci-fi bench, Miniaturized, interactive, Flush installation, Anti-slip surface, Illuminated edges, Boosted motors, Grip tape detailing, Customizable wheels, Abrasive sandpaper texture, low brightness, non-reflective, Procedural generation techniques, Seamless mesh, unified surfaces

특히 첫 번째 이미지의 의자와 두 번째 이미지의 P2, P3에 있는 의자를 재질 특성에 초점을 맞춰 비교하는 것이 주목할 만합니다. 반사 특성에 대한 설명은 생성된 결과물에 상당한 영향을 미치며, 이는 여러 실험에서 일관되게 효과적이었습니다. 지면 제약상 모든 예시를 여기에 표시하지는 않겠습니다.

이어서, 3D 모델링에 익숙하다면 모델 생성 과정에서 '대칭'의 중요성을 아실 것입니다. 따라서 필요한 경우, AI에게 '대칭'에 특별히 집중하도록 상기시키는 것을 잊지 마세요.

Prompt:Security turret, Tactical, time-telling, 360-degree surveillance, Automated targeting, Infrared vision, Augmented vision, Prescription compatibility, Lightweight frame, Composite fiber paneling, moderate brightness, reduced reflectivity, Immersive world-building, Intentional reflective design, deliberate symmetry

Image to 3D 기능:

물론 이 이미지처럼 Image to 3D 기능을 사용할 수도 있습니다. Tripo AI를 사용할 때 'Image to 3D'를 선택하고 이미지를 업로드한 다음 Draft 버튼을 클릭하기만 하면 됩니다. 시스템은 먼저 이미지에서 주제를 자동으로 추출한 다음 모델을 생성합니다. 개인적으로 저는 초기 초안의 정확성을 보장하기 위해 Photoshop에서 이미지를 미리 편집(전경 추출)하는 것을 선호합니다. 자동으로 분할될 때 때때로 흐릿하게 나타날 수 있기 때문입니다.

그 후, 모델의 정밀도를 높이기 위해 Refine을 클릭합니다. 최종적으로 얻은 모델은 다음과 같습니다. 다운로드를 클릭하여 전문 3D 소프트웨어로 가져와 추가 정밀 작업을 할 수 있습니다.

다음은 다른 Image-to-3D 예시입니다:

Tripo AI를 탐색하고 저희 미디어 플랫폼에 참여하세요:

원본 문서: https://medium.com/@thegodtripo/ultimate-tripo-ai-guide-i-prompt-tips-and-tricks-for-text-image-to-3d-cd49523b10ae

작성자: Lyson(Twitter@lyson_ober), 편집자: Oliver

Advancing 3D generation to new heights

moving at the speed of creativity, achieving the depths of imagination.