私の経験上、ソーシャルARレンズにAI 3D生成を活用することは、単なる目新しさではなく、数日かかっていた作業を数時間に短縮する根本的な変化です。コンセプトから、レンズプラットフォーム向けのテクスチャ付きで最適化された3Dアセットを1時間以内に作成できるようになりました。これは、従来であれば、かなりのモデリングと技術スキルが必要だったプロセスです。このガイドは、複雑な3Dソフトウェアに時間を費やすことなく、ソーシャルメディアの速度で魅力的でパフォーマンスの高いARコンテンツを作成したいアーティスト、デザイナー、開発者向けです。AR独自の制約に合わせてAIをガイドし、その出力を洗練された最終アセットに統合する方法を理解することが鍵となります。
主なポイント:
ソーシャルARレンズは、特定の種類の3Dアセットを要求します。それは、電話の画面で腕を伸ばした距離でも視覚的に魅力的であること、リアルタイムで動作するために信じられないほど軽量であること、そしてエンゲージメントを促進するために様式化されていたり、風変わりであったりすることが多いものです。ポリゴン数は数千台、テクスチャは小さく、リグはシンプルでなければなりません。従来のハイポリゴンで映画品質のモデリングは、過剰であるだけでなく、使用できません。トレンドの動きが速いため、ワークフロー全体が速度とイテレーションに重点を置いています。
従来のボトルネックは常に初期の3Dモデリングでした。非専門家にとっては参入障壁であり、専門家にとっては、AR向け最適化という本来の作業が始まる前の時間のかかる最初のステップでした。AI生成はこのボトルネックを直接攻撃します。今では、「驚いた表情の可愛いローポリゴンの幽霊」というコンセプトを入力するだけで、数秒で実行可能な3Dメッシュを得ることができます。これにより、プロジェクトは白紙の状態から、ARにとって真の価値が加わる改良と技術の段階へと瞬時に移行します。
私のワークフローは根本的に変わりました。以前は、モデルのブロックアウトに1日を費やしていました。今では、コンセプトのバリエーションを5〜10種類生成するのに1時間しかかかりません。この初期段階での創造的な選択肢の爆発的な増加は革新的です。最近、一連のキャラクターレンズを作成しましたが、AIを使って、ある朝のうちに「ファンタジー生物」のプロンプトで異なる体型やスタイルを試すことができました。この迅速なプロトタイピングにより、より良い意思決定とより創造的なリスクテイクが可能になります。なぜなら、「悪い」アイデアのコストは時間ではなく秒単位で測られるからです。
プロンプトは新しい設計図です。私は、最初の入力からARのニーズを明確に伝えることを学びました。ただ「魔法使いの帽子」と言うのではなく、**「モバイルARフィルターに適した、シンプルな形状の様式化されたローポリゴンの魔法使いの帽子、カートゥーンスタイル」**と伝えます。これにより、よりクリーンなジオメトリの生成を促します。特定のシルエットを固定するために、テキストと一緒にシンプルなスケッチや参照画像をインプットとして使用することがよくあります。これは、アクセサリーのようなレンズオブジェクトに対して、より予測可能な結果を生み出すことを発見しました。
複数のオプションを生成し、全体的に最もクリーンな形状を持つものを選択します。最初の出力が完璧であることはめったにありません。次のステップは常にAIプラットフォーム内で行います。組み込みのリメッシュまたはリトポロジーツールを使用して、ポリゴンフローを削減し、クリーンにします。例えば、Tripo AIでは、生成されたモデルをインテリジェントなリトポロジー機能に通し、5k未満の三角形数を目標とします。これにより、クワッドとクリーンなエッジループを備えた新しいアニメーション対応メッシュが作成されます。これは、アセットがリグされる場合に、いかなる変形に対しても不可欠です。
AIが生成するテクスチャは素晴らしい出発点ですが、モバイル向けに調整が必要なことがよくあります。AIは4Kのテクスチャマップを生成するかもしれませんが、ARでは1024x1024を超えることはほとんどなく、512x512で十分な場合が多いです。AIのテクスチャ出力をベースとして使用し、標準の3Dスイートで、それを単一の最適化されたテクスチャアトラスにベイクします。マテリアルは常にモバイルフレンドリーなPBRワークフロー(Albedo、Normal、Roughness)に変換します。レンズの場合、エミッシブまたはアンリットシェーダーは、フルPBRよりもパフォーマンスが高く、視覚的に一貫していることがよくあります。
これは必須です。すべてのレンズプラットフォームには厳格な制限があります。私の経験則では、シンプルなオブジェクトで5,000トライアングル未満、複雑なリグ付きキャラクターで15,000トライアングル未満に抑えることです。生の値よりも重要なのはトポロジーの品質です。メッシュは水密でなければならず、アニメーション化する場合は、ジョイントの周りにきれいなエッジループが必要です。私は他のどの作業よりもここに時間を費やします。完璧に配置された10kトライアングルのモデルは、乱雑な5kモデルよりもパフォーマンスが良く、よりスムーズにアニメーションします。
テクスチャメモリはパフォーマンスに大きな影響を与えます。私の標準的な実践方法:
避けるべき落とし穴: AIに複数の2K/4Kテクスチャマップを生成させること。これは、レンズのパフォーマンスを著しく低下させる誤った品質感を生み出します。積極的にダウンサンプルし、アトラス化してください。
アセットを動かす必要がある場合は、生成段階から計画してください。プロンプトには「rigged」または「posed」を含めて、適切なTポーズまたはAポーズのモデルを得るようにします。AIの自動リギングツールは、基本的な人型オブジェクトに対しては非常に優れています。私はそれらを使って、生成されたクリーチャーに標準的な二足歩行リグを迅速に適用してきました。ただし、標準的でない形状(ゆらゆらしたゼリーのようなもの)の場合、自動リグを適応させようとするよりも、手動で作成するシンプルなカスタムリグの方が効率的で軽量であることがよくあります。ボーン数を少なく保ちましょう。
これが核となるトレードオフです。AIは速度とアイデア出しに優れています。 私は数分でモデルの基本ジオメトリとテクスチャを生成できます。従来のモデリングは精度と制御に優れています。 特定の顔のランドマークに完璧にフィットしたり、複雑な環境とインタラクトしたりする必要があるレンズアセットの場合、私は今でも手動でモデリングします。実際には、初期アセットの80%(特に様式化された小道具、キャラクター、アクセサリー)にはAIを使用し、ミリ単位の精度や非常に具体的で設計されたジオメトリが必要な20%には従来の方法を使用しています。
AIは私のパイプラインを置き換えるのではなく、フロントエンドを大幅に強化します。私の標準的なワークフローは次のとおりです:コンセプトとプロンプト → AI生成 → Blender/Unityへのエクスポート → リトポロジーと最適化 → 最終テクスチャリングとリギング → Lens Studio/Spark ARへのインポート。 AIのステップは最初からシームレスに組み込まれています。エクスポートされたFBXまたはglTFファイルは、使い慣れたソフトウェアにそのまま取り込まれ、そこでプラットフォーム固有の最適化と統合をすべて適用します。このハイブリッドアプローチにより、両方の良いとこ取りができます。
私の意思決定ツリーは単純です:
まとめると、AI 3D生成は、ソーシャルARプロジェクトを開始するための私の頼りになるツールとなりました。初期作成の重労働をAIが担うことで、私は成功するレンズにとって本当に重要なこと、つまりパフォーマンスの最適化、クリエイティブな磨き上げ、魅力的なインタラクションデザインに専門知識を集中させることができます。
moving at the speed of creativity, achieving the depths of imagination.
テキスト・画像から3Dモデルを生成
毎月無料クレジット付与
究極のディテール再現