TripoとStability AIによるTripoSRの紹介:1秒未満で高品質3Dモデルを生成

Gavin
· 2024/08/13

はじめに

TripoStability AIによって開発されたTripoSRは、単一画像から高速に3D再構築を行うための最先端のオープンソースモデルです。1秒未満で高品質な3Dモデルを生成できるため、エンターテイメント、ゲーム、工業デザイン、建築など、さまざまなアプリケーションに適しています。

パフォーマンス

TripoSRは、他の手法よりもはるかに高速に詳細な3Dモデルを作成できます。Nvidia A100でテストしたところ、ドラフト品質の3D出力(テクスチャ付きメッシュ)を約0.5秒で生成し、OpenLRMのような他のオープンな画像から3Dモデルを生成するモデルを上回るパフォーマンスを発揮します。その速度に加え、このモデルはGPUの有無にかかわらず、誰でも完全に利用可能です。

仕様

トレーニングデータの準備には、実世界の画像分布を正確に再現する多様なデータレンダリング技術が組み込まれており、モデルの汎化能力を大幅に向上させています。トレーニングデータには、Objaverseデータセットの高品質なCC-BYサブセットが注意深く厳選されています。モデル側では、ベースとなるLRMモデルに対して、チャネル数の最適化、マスク監視、より効率的なクロップレンダリング戦略など、いくつかの技術的進歩が導入されています。詳細については、技術レポートをご覧ください。

TripoSRは、開発者、デザイナー、クリエイターがその能力を探求し、その進化に貢献し、彼らの仕事や業界を変革する可能性を発見することを歓迎します。

TripoSRモデルのコードは現在、Tripo AIのGitHubで公開されており、モデルの重みはHugging Faceで入手できます。TripoSRモデルの詳細については、技術レポートをご参照ください。



Advancing 3D generation to new heights

moving at the speed of creativity, achieving the depths of imagination.