Estamos lançando o HoloPart em código aberto, um novo modelo generativo que compreende formas 3D componente por componente, desbloqueando poderosos fluxos de trabalho de edição, animação e criação.
Já tentou editar um modelo 3D baixado online, capturado por digitalizações ou gerado por IA? Frequentemente, são "blocos" únicos de geometria, tornando incrivelmente difícil ajustar, animar ou retexturizar componentes individuais, como a perna de uma cadeira ou os óculos de um personagem. As técnicas existentes de segmentação de peças 3D podem identificar patches de superfície visíveis pertencentes a diferentes partes, mas deixam você com peças quebradas e incompletas (Figura 1a). Isso limita fundamentalmente a sua utilidade para a criação de conteúdo no mundo real.
Hoje, temos o prazer de apresentar HoloPart, uma nova abordagem e projeto de código aberto que aborda este desafio diretamente. HoloPart introduz a tarefa de Segmentação Amodal de Peças 3D: decompor uma forma 3D não apenas em patches visíveis, mas em suas peças subjacentes completas e semanticamente significativas, inferindo até mesmo a geometria oculta por oclusão (Figura 1b).
No coração do HoloPart, um novo modelo generativo baseado em difusão que desenvolvemos. Estamos lançando o código, modelos HoloPart pré-treinados e uma demonstração interativa hoje, convidando a comunidade a construir sobre este trabalho.
Desenvolvedores podem testá-lo no Hugging Face.
Digitalizações de fotogrametria, modelos generativos e até mesmo muitos ativos feitos por humanos frequentemente carecem de estrutura interna de peças. Embora métodos como o SAMPart3D possam segmentar inteligentemente a superfície de um modelo 3D, eles não conseguem ver "através" do objeto. Se você segmentar um anel usando esses métodos, obtém a superfície externa visível da gema e do aro, mas não a forma completa da gema ou o aro completo onde eles se intersectam ou são ocluídos.
Essa limitação é um grande gargalo para:
Inspirado no conceito de percepção amodal (nossa capacidade de perceber objetos inteiros mesmo quando parcialmente escondidos), o projeto HoloPart introduz a Segmentação Amodal de Peças 3D. Conseguimos isso através de uma abordagem prática de duas fases:
O HoloPart não está apenas "preenchendo buracos". Construído sobre o forte conhecimento generativo do nosso modelo fundamental TripoSG, ele aproveita uma profunda compreensão da geometria 3D aprendida através de extenso pré-treinamento em grandes conjuntos de dados (como Objaverse) e ajuste fino especializado em dados de parte-todo. O HoloPart adapta a poderosa arquitetura de transformador de difusão do TripoSG para a tarefa específica de completude de peças. Sua principal inovação reside em um mecanismo de atenção dupla:
Isso permite que o HoloPart reconstrua inteligentemente a geometria oculta, mesmo para peças complexas ou oclusão significativa, enquanto respeita a estrutura geral do objeto.
Estabelecemos novos benchmarks usando os conjuntos de dados ABO e PartObjaverse-Tiny para avaliar esta nova tarefa definida no projeto HoloPart. Nossos experimentos mostram que o HoloPart supera significativamente os métodos de completude de forma de última geração existentes quando aplicados a esta desafiadora tarefa de completude de peças.
Qualitativamente, a diferença é clara: onde outros métodos frequentemente falham em estruturas complexas ou produzem resultados incoerentes, o HoloPart gera consistentemente peças completas e de alta fidelidade que se alinham perfeitamente com a forma original.
Ao gerar peças completas, o HoloPart desbloqueia uma série de aplicações poderosas que antes eram difíceis ou impossíveis de alcançar automaticamente:
Acreditamos que a Segmentação Amodal de Peças 3D, conforme explorada no projeto HoloPart, é um passo crucial para uma criação de conteúdo 3D mais intuitiva e poderosa. Estamos lançando o HoloPart sob uma licença de código aberto para capacitar pesquisadores e desenvolvedores.
Estamos ansiosos para ver o que a comunidade construirá com essas ferramentas. Mergulhe, experimente e diga-nos o que você pensa!
moving at the speed of creativity, achieving the depths of imagination.