3Dコンテンツ制作の分野は爆発的に拡大しています。洗練された従来のワークフローと、TripoのようなAIを活用した生成ツールの急速な台頭の両方に後押しされ、高品質な3Dアセットへの需要が急増しています。しかし、依然として重大なボトルネックが存在します。それはリギングです。静的な3Dメッシュを、スケルトンとスキニングウェイトを持つアニメーション可能なキャラクターに変えることは、複雑で時間のかかる、多くの場合手作業を要するプロセスであり、かなりの専門知識が求められます。
既存の自動化ソリューションは部分的な解決策を提供しますが、しばしば不十分です。テンプレートベースの方法は、定義済みの構造(標準的な二足歩行キャラクターなど)内では優れていますが、今日作成されている多種多様なモデルに対する柔軟性に欠けます。テンプレートフリーのアプローチはより高い適応性を提供しますが、トポロジカルに有効なスケルトンの生成に苦労したり、複雑な後処理を必要としたりすることが多く、実用的な導入を妨げています。
本日、Tripoはこれらの制約を克服するために設計された、自動スケルトンリギングのための新しい統合フレームワークUniRigを発表できることを嬉しく思います。最新の研究論文「One Model to Rig Them All: Diverse Skeleton Rigging with UniRig」で詳しく説明されているように、UniRigは、人間や動物から複雑な架空のキャラクター、さらには無機構造物まで、前例のない多様な3Dモデルに対して高品質なスケルトンリグを生成できる強力なモデルです。
UniRigのアプローチ:自己回帰予測と新しいトークン化
UniRigの核となるのは、言語や画像生成の進歩を推進する大規模な自己回帰モデルの力を活用している点です。UniRigはピクセルや単語を予測する代わりに、3Dスケルトンの構造をジョイントごとに予測します。このシーケンシャルな予測プロセスは、トポロジカルに有効なスケルトンの生成を保証する上で重要です。
これを可能にする重要な設計は、私たちのSkeleton Tree Tokenization(スケルトンツリートークン化)手法です。複雑なジョイントの相互依存性を持つ階層的なスケルトン構造を、トランスフォーマーに適した線形シーケンスとして表現することは容易ではありません。私たちのトークン化スキームは、以下を効率的にエンコードします。
3Dコンテンツ制作の分野は爆発的に拡大しています。洗練された従来のワークフローと、TripoのようなAIを活用した生成ツールの急速な台頭の両方に後押しされ、高品質な3Dアセットへの需要が急増しています。しかし、依然として重大なボトルネックが存在します。それはリギングです。静的な3Dメッシュを、スケルトンとスキニングウェイトを持つアニメーション可能なキャラクターに変えることは、複雑で時間のかかる、多くの場合手作業を要するプロセスであり、かなりの専門知識が求められます。
既存の自動化ソリューションは部分的な解決策を提供しますが、しばしば不十分です。テンプレートベースの方法は、定義済みの構造(標準的な二足歩行キャラクターなど)内では優れていますが、今日作成されている多種多様なモデルに対する柔軟性に欠けます。テンプレートフリーのアプローチはより高い適応性を提供しますが、トポロジカルに有効なスケルトンの生成に苦労したり、複雑な後処理を必要としたりすることが多く、実用的な導入を妨げています。
本日、Tripoはこれらの制約を克服するために設計された、自動スケルトンリギングのための新しい統合フレームワークUniRigを発表できることを嬉しく思います。最新の研究論文「One Model to Rig Them All: Diverse Skeleton Rigging with UniRig」で詳しく説明されているように、UniRigは、人間や動物から複雑な架空のキャラクター、さらには無機構造物まで、前例のない多様な3Dモデルに対して高品質なスケルトンリグを生成できる強力なモデルです。
UniRigのアプローチ:自己回帰予測と新しいトークン化
UniRigの核となるのは、言語や画像生成の進歩を推進する大規模な自己回帰モデルの力を活用している点です。UniRigはピクセルや単語を予測する代わりに、3Dスケルトンの構造をジョイントごとに予測します。このシーケンシャルな予測プロセスは、トポロジカルに有効なスケルトンの生成を保証する上で重要です。
これを可能にする重要な設計は、私たちのSkeleton Tree Tokenization(スケルトンツリートークン化)手法です。複雑なジョイントの相互依存性を持つ階層的なスケルトン構造を、トランスフォーマーに適した線形シーケンスとして表現することは容易ではありません。私たちのトークン化スキームは、以下を効率的にエンコードします。