Apresentando TripoSR por Tripo e Stability AI: Modelos 3D de Alta Qualidade em Menos de um Segundo

Gavin
· 2024/08/13

Introdução

TripoSR, desenvolvido por Tripo e Stability AI, é um modelo de código aberto de ponta projetado para a rápida reconstrução 3D a partir de uma única imagem. Ele gera modelos 3D de alta qualidade em menos de um segundo, tornando-o adequado para diversas aplicações em entretenimento, jogos, design industrial e arquitetura.

Desempenho

O TripoSR pode criar modelos 3D detalhados muito mais rapidamente do que outros métodos. Quando testado em uma Nvidia A100, ele gera saídas 3D de qualidade de rascunho (malhas texturizadas) em cerca de 0,5 segundos, superando outros modelos abertos de imagem para 3D como o OpenLRM. Além de sua velocidade, este modelo é totalmente acessível a usuários com ou sem GPUs.

Especificações

A preparação dos dados de treinamento incorpora diversas técnicas de renderização de dados que replicam com precisão a distribuição de imagens encontradas no mundo real, aprimorando significativamente a capacidade de generalização do modelo. Ele seleciona meticulosamente um subconjunto CC-BY de qualidade superior do conjunto de dados Objaverse para os dados de treinamento. No lado do modelo, ele introduz vários avanços técnicos em relação ao modelo base LRM, incluindo otimização do número de canais, supervisão de máscara e uma estratégia de renderização de corte mais eficiente. Você pode ler o relatório técnico para mais detalhes.

O TripoSR convida desenvolvedores, designers e criadores a explorar suas capacidades, contribuir para sua evolução e descobrir seu potencial para transformar seu trabalho e suas indústrias.

O código para o modelo TripoSR já está disponível no GitHub da Tripo AI, e os pesos do modelo estão disponíveis no Hugging Face. Por favor, consulte nosso relatório técnico para mais detalhes sobre o modelo TripoSR.



Advancing 3D generation to new heights

moving at the speed of creativity, achieving the depths of imagination.