Tripo와 Stability AI의 TripoSR 소개: 1초 미만에 고품질 3D 모델 생성

Gavin
· 2024/08/13

서론

TripoStability AI가 개발한 TripoSR은 단일 이미지로부터 빠른 3D 재구성을 위해 설계된 최첨단 오픈 소스 모델입니다. 1초 미만에 고품질 3D 모델을 생성하여 엔터테인먼트, 게임, 산업 디자인 및 건축 분야의 다양한 애플리케이션에 적합합니다.

성능

TripoSR은 다른 방법에 비해 훨씬 빠르게 상세한 3D 모델을 생성할 수 있습니다. Nvidia A100에서 테스트했을 때, 약 0.5초 만에 초안 품질의 3D 출력(텍스처 메시)을 생성하여 OpenLRM과 같은 다른 오픈 이미지-투-3D 모델보다 뛰어난 성능을 보였습니다. 속도 외에도 이 모델은 GPU 유무에 관계없이 모든 사용자가 완전히 액세스할 수 있습니다.

사양

학습 데이터 준비는 실제 이미지 분포를 정확하게 재현하는 다양한 데이터 렌더링 기술을 통합하여 모델의 일반화 능력을 크게 향상시킵니다. 학습 데이터를 위해 Objaverse 데이터셋의 CC-BY, 고품질 하위 집합을 세심하게 선별합니다. 모델 측면에서는 채널 수 최적화, 마스크 감독, 보다 효율적인 크롭 렌더링 전략을 포함하여 기본 LRM 모델에 비해 여러 기술적 진보를 도입합니다. 더 자세한 내용은 기술 보고서를 참조하십시오.

TripoSR은 개발자, 디자이너 및 크리에이터가 그 기능을 탐색하고, 진화에 기여하며, 작업 및 산업을 변화시킬 잠재력을 발견하도록 초대합니다.

TripoSR 모델 코드는 이제 Tripo AI의 GitHub에서 사용할 수 있으며, 모델 가중치는 Hugging Face에서 사용할 수 있습니다. TripoSR 모델에 대한 자세한 내용은 기술 보고서를 참조하십시오.



Advancing 3D generation to new heights

moving at the speed of creativity, achieving the depths of imagination.