私の日常業務では、AI 3D生成とフォトグラメトリーのどちらを選ぶかは、どちらが普遍的に「優れているか」ではなく、特定のタスクにとってどちらがより正確かという問題です。私は、概念的な精度、つまり形状やスタイルの本質が最重要である場合に、AI生成の比類ないスピードとクリエイティブな柔軟性を活用します。実世界のオブジェクトに対してミリメートル単位の完璧な幾何学的忠実度が必要な場合は、フォトグラメトリーに頼ります。しかし、最も強力なワークフローは、多くの場合、両方を組み合わせるものです。AIをベースメッシュの作成やスキャンの隙間を埋めるために使用し、フォトグラメトリーでシーンを物理的な現実に根付かせます。このガイドは、品質と効率の両方でパイプラインを最適化するために、情報に基づいた実用的な決定を下す必要がある3Dアーティスト、デザイナー、開発者向けです。
主なポイント:
クライアントから「正確な」モデルを求められたとき、私が最初に行うのは、その意味を明確にすることです。実際には、精度を3つの明確で測定可能な要素に分解しています。
これはコアとなる3D構造です。フォトグラメトリーは通常、ここで優位に立ちます。写真からオブジェクトの正確な比率とスケールを数学的に再構築するためです。私の経験では、AI生成モデルは2D入力から認識された形状を見事に捉えることができますが、真のスケールや見えないジオメトリの理解は解釈的です。AIが側面図から説得力のある車のモデルを生成したものの、ホイールベースやキャビンの奥行きが見積もりであったという経験があります。
フォトグラメトリーの場合、幾何学的精度はキャプチャ品質と処理ソフトウェアの直接的な関数です。AIの場合、トレーニングデータとプロンプトまたは入力画像の具体性にかかっています。
ここでは、線が曖昧になります。最新のフォトグラメトリーは、見事な写真のように正確なテクスチャを生成し、ひび割れや布地の織り目などの細かい表面の詳細を捉えます。特に画像から3Dへのツールを使用するAI生成は、現在では非常にリアルなPBR(Physically Based Rendering)マテリアルを生成できます。私が観察する違いはソースにあります。フォトグラメトリーのテクスチャは直接的なデータキャプチャですが、AIのテクスチャは洗練された合成です。
AIはもっともらしいが不正確な微細な詳細を「幻覚」として生成することがあるのに対し、フォトグラメトリーは照明の悪い領域で詳細を見逃し、穴やぼやけたパッチを残すことがあると私は感じています。
これは重要であり、しばしば見過ごされる側面です。フォトグラメトリーは、特定の照明下で一瞬を捉えます。満開の夏の木のモデルが必要な場合は、夏にスキャンする必要があります。AI生成にはそのような制約はありません。窓の外の季節に関係なく、数秒でテキストから「夏のオークの木」や「冬の白樺の木」を生成できます。
同様に、混雑した公共広場をフォトグラメトリーでキャプチャすることは、一時的な人々や車を取り除くという課題があります。AIを使えば、それらの一時的な要素なしに広場の本質を記述できます。
ここでの私の目標は、AIをできるだけ正確に誘導し、その出力を検証して修正することです。これは共同作業であり、ワンクリックソリューションではありません。
テキストから3Dへの場合、私は詩ではなく、技術的な要約のようにプロンプトを作成します。「かっこいいSFガン」ではなく、**「かさばるSFブラスターライフル、左右対称、円筒形の銃身、上部に長方形のパワーコア、テクスチャード加工のピストルグリップ。アイソメトリックビュー、クリーンな白い背景。」**のように記述します。特定の形状、向き、背景の記述は、幾何学的整合性を劇的に向上させます。
画像から3Dへの場合、私は最もクリーンで、最も直交した参照から始めます。中立的な背景にある正面向きの製品写真は、AIに最も強力な信号を与えます。Tripo AIのようなプラットフォームでは、スケッチから3Dへの機能を使用してシンプルな2Dシルエットを描くことがよくあります。これにより、AIが奥行きと詳細を追加する前に、コアプロファイルを直接制御できます。
私のパイプラインでは、AI出力は最終ではありません。最初のステップは常に3Dビューアでの視覚検査です。浮遊ジオメトリ、内部面、非多様体エッジ(私がすぐにクリーンアップする一般的なアーティファクト)を探します。
次に、ほとんどの場合、モデルをリトポロジープロセスに通します。AIモデルはしばしば密で不規則なポリゴンフローを持っています。インテリジェントなリトポロジーツール(Tripoに組み込まれているものなど)を使用すると、元の形状とUVを維持しながら、最適化されたポリゴンでクリーンでアニメーション対応のメッシュを迅速に生成できます。これは、ゲームエンジンやリアルタイムアプリケーション向けのアセットにとって、必須のステップです。
私は常にAI生成モデルを、既知のスケール参照(通常はプリミティブキューブまたは人間のモデル)を含むシーンにインポートします。私は尋ねます:ドアノブは信頼できる高さにありますか?椅子の座面の奥行きは妥当ですか?参照に対して「適切に」感じるまで、スケールを均一に調整します。
複雑なオブジェクトの場合、3Dモデルとソース参照画像をPhotoshopまたはコンポジターに読み込み、正投影図で重ね合わせて、シルエットのずれや主要な比率をチェックすることがあります。
これは、キャプチャ中の現場で精度が決定される、系統的で物理法則に縛られたプロセスです。
照明がすべてです。私は拡散した曇り空の光で撮影するか、ライトテントを使用して、処理ソフトウェアを混乱させる強い影やハイライトを排除します。私の黄金律は高い重複です。各写真は次の写真と70〜80%のコンテンツを共有する必要があります。オブジェクトの周りを体系的なグリッドで移動し、可能であれば上部と下部を含むすべての角度からキャプチャします。
私は常にシーンにスケールマーカー(チェッカーボードパターンや物理的な定規など)を含めます。これにより、ソフトウェアは既知の測定値でキャリブレーションでき、実世界のスケールがモデルに最初から組み込まれます。
私の意思決定マトリックスは、すべてのプロジェクトの開始時に評価する3つの主要なトレードオフに基づいています。
コンセプトモデルやムードアセットの場合、AI生成は無敵です。頭の中の「中世の居酒屋のスツール」から、2分以内にシーンで使えるテクスチャ付き3Dモデルを作成できます。実際のスツールのフォトグラメトリースキャンは、セットアップ、キャプチャ、処理に1時間かかり、クリーンアップさえ始まっていません。
製品コンフィギュレーターや文化遺産保存プロジェクトの場合、綿密なフォトグラメトリースキャンに費やす日数は譲れません。精度が製品そのものです。AIの速度はここでは関係ありません。その解釈的な性質は許容できない誤差範囲をもたらすからです。
新しいものをデザインしているとき(キャラクター、車両、ファンタジー建築など)、AI生成はクリエイティブなパートナーです。「もしこうだったら?」というシナリオ(例:「同じ椅子だけどアールデコスタイル」)を瞬時に反復できます。フォトグラメトリーは物理的に存在しないものを作成することはできません。
特定の、実在するオブジェクト(クライアントの既存製品、歴史的遺物、ユニークな地層など)が必要な場合、フォトグラメトリーは真のデジタルツインを保証する唯一の方法です。AIは近づくかもしれませんが、正確ではありません。
AI生成は参入障壁が低いです。必要なのはサブスクリプション料金とインターネット接続だけです。専門的なハードウェアではなく、芸術的なディレクションが必要です。完璧な実世界との一致がそれほど重要でない、プロトタイピングや予算の厳しいプロジェクトの私のデフォルトです。
フォトグラメトリーは、優れたカメラ、レンズ、照明、処理ソフトウェアのライセンスにかなりの投資が必要です。また、被写体への物理的なアクセスも必要です。映画の小道具、美術館の展示品、エンジニアリングコンポーネントなどの高価値アセットには、そのコストは正当化されます。
私のスタジオで最も効率的なパイプラインは、これらの方法を互いに対立させるのではなく、連携させます。
スキャンの最も難しい部分を解決するためにAIを使用することがよくあります。例: 歴史的な部屋をスキャンしましたが、家具の一部がありません。ゼロからモデリングする代わりに、その家具スタイルの古い写真を画像から3DへのAIに入力して、もっともらしい代替モデルを生成し、それをスキャンされたシーンにスケールして統合します。AIは欠落データの「塗りつぶしツール」として機能します。
重要なのは、一貫した照明とマテリアル応答です。AI生成アセットをフォトグラメトリーでキャプチャされた環境に配置する場合、まずスキャンされたシーンのHDR照明を分析します。次に、その照明データを使用してAIアセットを再シェーディングおよび再テクスチャリングし、そのマテリアルが同じ方法で光に反応するようにして、「CGIが貼り付けられた」ような見た目を避けます。PBRマテリアル出力を提供するツールは、この統合をはるかにスムーズにします。
moving at the speed of creativity, achieving the depths of imagination.
テキスト・画像から3Dモデルを生成
毎月無料クレジット付与
究極のディテール再現