このPerchance AIチュートリアルで、プロシージャルキャラクター作成の完全なワークフローを学びましょう。プロンプトの構文、2D生成、そして迅速な画像から3Dへの変換をマスターします。
キャラクターをプロシージャルに生成するには、テキストから画像への生成およびその後のアセット統合に対する特定の制御が必要です。制作チームや個人クリエイターにとって、生のテキストプロンプトからエンジン対応のファイルへアセットを移行するプロセスは、プロジェクトのスケジュールを左右します。本書では、Perchance AIを使用して2Dキャラクターのコンセプトを作成するステップバイステップのプロセスを概説し、アセット変換中にパイプラインが停滞する一般的な箇所を特定し、フラットな画像を実用的な3Dメッシュに変換する方法を実演します。
テキスト生成における変数と構文を制御することで、再現性のあるキャラクター出力を得ることができます。これらの2D出力を3D環境に統合するには、大規模な手動リトポロジーを必要とせずに、ジオメトリとテクスチャが標準的なレンダリングソフトウェアに正しく読み込まれるようにするための特定の変換ステップが必要です。
Perchance AIを効果的に使用するには、基本的なリストの設定と構文ルールの構築が必要です。このセクションでは、生成環境を構築し、予測可能なコンセプトアートのために出力パラメータを制御する方法を解説します。
Perchanceプラットフォームは、ルールベースのテキストエンジンとして機能します。制約内でバリエーションを出力するために、構文設定に依存しています。キャラクターの説明を予測可能に生成するということは、コアリストを設定し、各キャラクターの特性に明確な変数を割り当てることを意味します。
このプラットフォームは、コーディング入力と生成出力を分離しています。ジェネレーターを開始するには、プロンプトを構築する際にシステムが参照するデータリストを概説する必要があります。
output とラベル付けされる、主要な出力変数を定義します。species(種族)、class(クラス)、clothing(服装)、environment(環境)などの明確なテキストグループを設定します。[species] [class] wearing [clothing] のように構造化されたブラケット形式を使用して、主要な出力内でこれらの特定のサブリストを参照します。このようにデータを構造化することで、機能的なプロンプトの基盤が構築されます。これにより、プロンプト構造を壊すことなく、リストで定義された正確なパラメータに基づいて、システムが明確な視覚的特性を引き出すことが可能になります。
プロンプトの精度は、特定のテキスト演算子に依存します。エンジンは、出力頻度とテキスト形式を調整するために所定の文字を使用します。
{}:インラインオプションを示します。{red|blue|green} と入力すると、3つの色に選択肢が均等に分配されます。^:特定のアイテムの選択頻度を調整します。行を legendary armor ^0.1 とフォーマットすると、basic leather armor ^5 と比較して出現率が低下します。.titleCase を追加すると、出力が自動的にタイトルケース(各単語の先頭を大文字)になり、後続の画像ジェネレーター入力用にテキストブロックをきれいにフォーマットします。これらの演算子を設定することで、出力の多様性を制御します。これにより、画像生成フェーズの視覚的参照入力に直接変換される正確なテキスト説明が生成されます。
構造化されたテキストをキャラクターコンセプトに変換するには、統合された画像ジェネレーターを使用します。このフェーズでは、視覚的な詳細を固定するために、特定のプロンプト構造化と反復的なパラメータ調整が必要です。

テキスト設定が意図した通りに動作することを確認した後、テキスト文字列は内部画像ジェネレーターにルーティングされます。このインターフェースは、記述的なテキスト変数を視覚的なキャラクターコンセプトに変換します。
機能的なキャラクターコンセプトを生成するには、特定のテキストシーケンスが必要です。画像エンジンは、入力が被写体、服装、照明、技術的フォーマットの順に並んでいる場合に最も効果的にデータを処理します。
機能的なシーケンスは通常、[被写体の定義], [詳細な服装], [照明条件], [アートスタイル], [技術的パラメータ] の順序で変数を並べます。
「戦士」のような基本的な入力を、「そびえ立つエルフの戦士、複雑な黒曜石のプレートアーマーを着用、映画のようなリムライト、ダークファンタジーのコンセプトアートスタイル、8k解像度、高精細」のようなシーケンスに置き換えることで、より実用的な参照資料が生成されます。
正投影、セルシェーディング、物理ベースレンダリング(PBR)などのレンダリング形式を指定することで、アセットのベースラインとなるシェーディング動作が確立され、異なる生成バッチ間で視覚的な出力が標準化されます。
初回生成では、通常、パイプラインの要件を満たすためにパラメータの調整が必要です。特定の制約を調整することで、レンダリングエラーを修正します。
[negative: ...] タグを適用することで、レンダリングから除外する要素をシステムに指示します。キャラクターコンセプト作成における標準的な除外項目には、[negative: overlapping geometry, asymmetrical armor, low resolution, multiple weapons] などがあります。shape=portrait を、広角の環境参照には shape=landscape を使用することで、被写体がキャンバスに収まる方法を変更します。標準的な2D画像は、ゲームエンジンへの統合において即座に問題を引き起こします。コンセプトフェーズを越えて進むには、フラットな画像生成の構造的な限界を認識し、それらを使用可能な3D形式に変換する方法を評価する必要があります。
テキストジェネレーターを使用すると初期のコンセプトフェーズは加速しますが、それらの視覚ファイルを標準的なプロジェクト環境に移行すると、即座に互換性の問題が露呈します。
生成された2Dファイルは、完全にフラットなピクセルグリッドです。これらには、深度情報、ポリゴンメッシュデータ、または機能的なマテリアルマップが含まれていません。Unreal Engine、Unity、またはMayaを使用する標準的な制作環境では、標準的な画像ファイルはリアルタイムの照明計算を処理したり、シーン内で回転するキャラクターモデルとして機能したりすることはできません。
システムに同じキャラクターの側面や背面を生成するように促して正投影のターンアラウンドを作成しようとしても、通常は失敗します。テキストから画像へのシステムは、複雑な正面向きのコンセプトの別の角度を生成する際、構造的な詳細を省略したり、アーマーの配置を混同したり、キャラクターのプロポーションを変化させたりすることが頻繁にあります。
標準的なワークフローは、フラットなコンセプト画像を3Dアーティストに渡し、手動で再作成することに依存しています。このプロセスは、スケジュールに大幅な遅延をもたらします。ベースメッシュの構築、ハイポリゴンのスカルプト、エッジフローのための手動リトポロジーの処理、UV展開には、アセットごとにかなりの時間を要します。
プロジェクトが迅速な初期コンセプト作成に依存している場合、すべてのフラットなアセットを標準的な手動モデリングスケジュールに通すと、初期の時間短縮効果が相殺されてしまいます。アセットパイプラインを動かし続けるには、長時間のモデリングフェーズを経ずに、フラットな画像データをベースとなる幾何学的メッシュに処理するための直接的な方法が必要です。
3D生成ツールを直接統合することで、モデリングのバックログに対処します。Tripo AIを使用すると、フラットなコンセプトをベースとなる幾何学的メッシュに即座に変換でき、標準的な3D形式への移行を自動化できます。

メッシュ生成の遅延を解決するために、パイプラインに迅速な画像から3Dへの変換ソフトウェアを組み込むことができます。Perchanceからのフラットな出力を専用の3Dモデルを通じて処理することで、視覚的な参照を操作可能なポリゴンジオメトリに直接変換します。
これらのフラットなファイルを処理するための非常に直接的な方法として、Tripo AIがあります。このシステムはアルゴリズム3.1で動作し、2000億以上のパラメータを活用して、大量の標準化された3Dメッシュファイルに対して処理を行い、2D形状を空間ジオメトリに解釈します。
変換プロセスは厳密なステップに従います:
このように変換を処理することで、ベースラインのプロトタイピングフェーズを数日かかるタスクから数分で完了するプロセスへと移行させ、ジオメトリ生成エラーを最小限に抑えます。
リグなしのメッシュを作成することでモデリングフェーズはカバーされますが、キャラクターをエンジンに統合するには機能的なアーマチュア(骨格)が必要です。スケルトンを構築し、メッシュの頂点全体にウェイトペイントを処理して動きの際のクリッピングを防ぐ作業は、技術的に非常に厳密な作業です。
リギングフェーズを効率化するために、Tripo AIには自動スケルトンバインディングツールが含まれています。メッシュ生成後、このツールはトポロジーを分析し、標準的な二足歩行リグをジオメトリにマッピングし、組み込みのアニメーションサイクルでウェイトをテストします。これにより、静的なアセットに標準的な移動制御が適用され、アニメーションステートに直接インポートできる標準的なボーン階層を持つファイルが出力されます。
モデルをレンダリングソフトウェアに読み込むには、正しいファイル拡張子が必要です。ファイルの互換性は、生成と実装の間の引き渡しを標準化します。Tripo AIは、標準的な業界ソフトウェアで必要とされる特定の形式でアセットを出力します。
オペレーターは、完成したメッシュをFBX、OBJ、STL、GLB、USD、または3MFファイルとして直接ダウンロードできます。これらの形式には、プロジェクトフォルダに直接インポートしたり、さらなる頂点調整のために二次的な3Dモデリングプログラムで開いたり、ハードウェア印刷のためにスライスソフトウェアで処理したりするために必要なメッシュ、テクスチャ、およびアーマチュアデータが含まれています。
2Dでの視覚的な一致には、テキストプロンプトの値を固定し、以前の出力から正確なシード番号を再利用する必要があります。3Dの一貫性については、マルチアングルのテキスト生成をスキップし、単一のしっかりとした正面向きの画像を3Dメッシュに処理することで、実際の頂点データがロックされ、シーン内のカメラアングルに関係なくプロポーションが完全に一致するようになります。
テキストから画像へのシステムは、標準的なPNGまたはJPEGファイルを出力します。これらはインターフェースグラフィックスまたは2Dスプライトとしてのみ機能します。機能的なキャラクターアセットを読み込むには、その画像をFBXやGLBのような、必要なトポロジーとUVマッピングを保持するポリゴン形式に処理する必要があります。
フラットな画像を専用の3Dジェネレーターにルーティングするのが最も高速です。画像を送信することで、システムのアルゴリズムが既存の空間データに基づいて欠落している深度座標を計算し、数秒でテクスチャ付きのドラフトメッシュを返し、ベースジオメトリを手動でブロックアウトする必要がなくなります。
ライセンスは、アセットを生成する特定のティア(プラン)とプラットフォームに完全に依存します。Tripo AIを通じてアセットを処理する場合、無料プランのユーザーは月間300クレジットを受け取りますが、このティアで生成されたモデルは非商用利用に限定されます。商用利用権が必要なユーザーは、月間3000クレジットを提供し、エクスポートされた3Dメッシュを制作プロジェクトで完全に商用実装することを許可するProティアにアップグレードする必要があります。