用户指南 (一): 探索 Tripo AI 的文本/图像生成 3D 功能,附有高效提示词的实用技巧

引言

大家好,我是 Lyson!

在过去一年中,GenAI (生成式人工智能) 领域持续快速发展。就在年初,我在 Bilibili 上发布了 Midjourney 的系统教程,而如今,AI 生成 3D 模型的技术也日益成熟。学习曲线的降低意味着你可以更快地掌握 3D 技能,让每个人都能体验到 3D 创作的乐趣。

探索潜力:Tripo AI + Blender + Magnific AI

在我最近的实验中,我深入探索了 Tripo AI 的奇妙世界,并将其与 BlenderMagnific AI 结合使用。结果如何?请欣赏下面的精美图片:

初次接触 Tripo AI,我仿佛回到了第一次使用 Midjourney V3 模型时的那种喜悦。与 3D 生成技术交织的另一个发展是 动作捕捉 技术。过去,获取高精度动作文件需要昂贵的设备,但如今,一部智能手机就能搞定。

3D 学习中的时间困境

许多人一直在思考学习 3D 建模所需的时间投入。这可是一笔巨大的投入!如果 AI 能直接生成模型,即使只达到 80% 的完成度,更不用说 100% 了,那也将是一个巨大的胜利。它能节省大量时间,特别是对于那些重复性的“搬砖”任务。这也是 Tripo AI 让我兴奋的原因之一!

挑战极限:与 Tripo AI 共度的一天

在我使用 Tripo AI 的第一天,我编写了 Python 脚本来批量处理数百个模型,以测试 Tripo AI 性能的极限。众所周知,提示词在文本生成中的重要性是至关重要的,尤其是在工具快速开发阶段。了解哪些提示词能高效工作,可以为创作过程节省宝贵时间。

在我的实验中,我逐步探索了不同的领域属性,从简单的形容词到纹理材质、颜色光泽,以及像“Masterpiece”(杰作)这样的提示词起始短语。

技巧与结论揭示

以下是我发现的一些关键技巧和结论:

  1. 简洁是关键: 目前,模型擅长理解主要对象和简短的修饰词。然而,长文本并不能显著提升细节。重点在于清晰地表达主要对象及其突出特征。
  2. 颜色提示词的力量: 当结果中呈现大面积的某种颜色时,颜色提示词效果最佳。仅通过语言描述两种以上的颜色可能具有挑战性——在专业 3D 软件中直接修改更符合工作流程。
  3. 起始短语的重要性: 一个好的起始短语可以为纹理带来意想不到的改进。记住并观察与高质量输出相关的提示词,并反复尝试。
  4. 材质至关重要: 描述材质优先于描述光源。模型对材质反射率的理解是精确的,值得关注。
  5. 多头问题”: 模型在第一个 Draft(草稿)阶段擅长生成良好的细节,但在第二个 Refine(精修)阶段有可能遇到“多头问题”,不过这在 3D 工作流程中可以轻松解决。

精心设计提示词:通过示例加深理解

现在,让我们通过示例来剖析这些见解,揭示可以增强你的理解并提升 3D 创作水平的细微之处。

简洁与起始短语的力量:“主语 + 1-3 个最突出的形容词 + 起始短语”公式:

Prompt: Cyberpunk mask, Compact, digital, Futuristic design, Voice modulator, Air filtration system, Quick-release mechanism, Concealed weapon storage, Biometric locking, Textured solar panel, moderate brightness, functional reflectivity, Sophisticated models, Smooth LOD transitions, gradient detail levels

在上述提示词中,除了某些更抽象的设计元素,模型对提示词的其他部分,尤其是 P4,表现出良好的理解。然而,这是否意味着更长的提示词更有价值呢?仔细审视这些提示词会发现,实际上,只有主要对象(面具)、最突出的描述性修饰词(cyberpunk, futuristic)以及起始短语(Smooth LOD transitions, gradient detail levels)具有显著的权重。接下来,我们继续比较一些来自社区的相关示例:

Prompt: a futuristic hardsurface helmet in green marble, high resolution

在这个例子中,提示词只有一个句子,但因为它完全融入了我提到的“主语 + 1-3 个最突出的形容词 + 起始短语”公式,所以它营造出一种高精度和如丝般光滑表面的印象。

现在,让我们看另一个例子:

Prompt: Cybernetic heart, display, Lifesaving, mechanical, High-definition screen, Laser-cut steel, Modular seat configuration, Anti-graffiti coating, Shimmering sequin texture, bright appearance, sparkling reflectivity, Realistic fluid dynamics simulation, Precision surface smoothing, artifact-free curvature

在这个例子中,P3 的赛博朋克电子心脏和 P4 的未来主义显示屏与 提示词的意图 非常吻合。观察我们长提示词的结构,我们注意到我们没有试图用过多的详细形容词来描述对象。因此,除了主要对象之外,大部分都属于起始短语的范畴,类似于“masterpiece”或“4k”这样的词。

然而,在 3D 领域,我们需要记住一些新的提示词才能获得更好的效果。例如:Shimmering sequin texture(闪烁的亮片纹理), bright appearance(明亮的外观), sparkling reflectivity(闪耀的反射率), Realistic fluid dynamics simulation(逼真的流体动力学模拟), Precision surface smoothing(精确的表面平滑), artifact-free curvature(无伪影的曲率)。你可能已经注意到,这些起始短语包含大量关于材质、反射效果和曲率的描述。因此,你也可以将起始短语视为这些可以显著影响 AI 输出的“3D 特性”。

一次只生成一个对象:

仔细观察你会发现,这个提示词似乎有两个看似并列的主题:一个 Cybernetic heart(赛博朋克心脏)和一个 display(显示屏)。对于 Stable Diffusion 而言,这样的提示词可能会导致图像模糊,或者两个元素出现在同一图像中,可能导致图像中的逻辑问题。

但在我对 Tripo AI 的实验中,我发现模型倾向于专注于绘制一个对象。因此,如果你的提示词包含 2 个对象,你可能会发现图像 1 完全是对象 A,而图像 2 则完全生成为对象 B。

这让我们对 AI 产品开发的当前阶段有了深入了解,并暗示了与 3D 工作流程的联系:一次只生成一个对象。

关于材质和对称性的考量:

Prompt 1:Sci-fi bench, Durable, rugged, Flush installation, Anti-slip surface, Illuminated edges, Slick oil surface texture, variable brightness, high reflectivity, Seamless 3D integration, Harmonious light mapping, balanced illumination
Prompt 2:Sci-fi bench, Miniaturized, interactive, Flush installation, Anti-slip surface, Illuminated edges, Boosted motors, Grip tape detailing, Customizable wheels, Abrasive sandpaper texture, low brightness, non-reflective, Procedural generation techniques, Seamless mesh, unified surfaces

特别值得注意的是,第一张图片中的椅子与第二张图片中 P2 和 P3 的椅子之间的对比,重点关注材质特性。对反射属性的描述对生成结果有显著影响,这在多次试验中都持续有效。由于篇幅限制,此处不再展示所有示例。

接下来,如果你熟悉 3D 建模,你会知道“对称性”在模型创建过程中的重要性。因此,如果需要,别忘了明确提醒 AI 专注于“对称性”。

Prompt:Security turret, Tactical, time-telling, 360-degree surveillance, Automated targeting, Infrared vision, Augmented vision, Prescription compatibility, Lightweight frame, Composite fiber paneling, moderate brightness, reduced reflectivity, Immersive world-building, Intentional reflective design, deliberate symmetry

图像生成 3D 功能:

当然,你也可以使用图像生成 3D 功能,就像这张图片一样。在使用 Tripo AI 时,选择“Image to 3D”(图像生成 3D),上传你的图片,然后点击 Draft(草稿)按钮。系统会首先自动从图片中提取主体,然后生成模型。我个人更倾向于在 Photoshop 中预先编辑图片(提取前景),以确保初始草稿的精确性,因为自动分割时有时可能会出现模糊。

之后,我们点击 Refine(精修)来提升模型的精确度。最终得到的模型如下。点击下载,你可以将其导入 专业 3D 软件 进行进一步的精修:

以下是其他图像生成 3D 的示例:

探索 Tripo AI 并加入我们的媒体平台:

原文: https://medium.com/@thegodtripo/ultimate-tripo-ai-guide-i-prompt-tips-and-tricks-for-text-image-to-3d-cd49523b10ae

作者:Lyson (Twitter@lyson_ober),编辑:Oliver

Advancing 3D generation to new heights

moving at the speed of creativity, achieving the depths of imagination.

一键生成任何3D内容
文字/图片转 3D 模型文字/图片转 3D 模型
每月获赠免费额度每月获赠免费额度
极致细节还原极致细节还原