Apresentando o Project Eden: Um Modelo de Mundo para Multijogador e Agentes

Banner do Project Eden mostrando uma maçã vermelha gigante em uma paisagem de cânion desértico, pela VAST AI Research

Estamos lançando uma prévia de pesquisa do Project Eden, um modelo de mundo persistente criado para uso multijogador e para agentes de IA que compartilham um único mundo consistente. Ele funciona continuamente, lembra o que você faz nele e permanece consistente independentemente de qual câmera o observa. A prévia técnica completa está disponível aqui: prévia de pesquisa do Project Eden.

A ideia por trás do Project Eden é simples de enunciar e difícil de construir. A maioria dos sistemas chamados de "modelos de mundo" atualmente são, na prática, geradores de vídeo — eles preveem o próximo quadro e esquecem tudo assim que ele sai da tela. O Project Eden mantém o mundo funcionando por baixo da imagem. Apague um incêndio e ele continua apagado. Vire as costas para uma parede e ela ainda estará lá quando você olhar de volta. Dois jogadores correm na mesma pista por ângulos diferentes e permanecem dentro da mesma realidade.

Essa diferença é o ponto central. As seções abaixo explicam por que isso importa e como funciona.

Por Que a Maioria dos "Modelos de Mundo" Não São

O vídeo generativo evoluiu muito. Modelos condicionados por ações respondem às suas entradas e produzem movimentos fluidos, e a indústria começou a chamá-los de modelos de mundo.

Mas há uma diferença entre prever pixels e simular um mundo. Gerar o próximo quadro diz como uma imagem deve mudar. Um modelo de mundo de verdade precisa rastrear o que esses pixels significam: os objetos, espaços, regras, memória e consequências físicas que devem permanecer no lugar, independentemente de uma câmera estar olhando ou não.

A pesquisa até agora se dividiu em dois caminhos, e cada um bate em uma parede.

A geração de vídeo condicionada por ações lida bem com o movimento, mas não tem memória duradoura. O "estado" do mundo vive dentro de uma janela curta de quadros recentes, então qualquer coisa que saia do campo de visão pode se desviar, desaparecer ou voltar de forma errada. Você tem tempo sem permanência.

A geração estática de cenas 3D oferece um espaço sólido e navegável, mas o congela. Física, eventos e mudanças não fazem parte do projeto. Você tem estrutura sem transformação.

Então um caminho lembra como as coisas se movem, mas esquece que elas existem. O outro lembra que elas existem, mas não permite que mudem. Um modelo de mundo de verdade precisa dos dois.

A Ideia Central: Estado Antes da Renderização

A principal escolha de design do Project Eden é separar o estado do mundo da renderização.

A realidade já funciona assim. O mundo existe antes de qualquer câmera olhar para ele. Essas são questões de estado, não de renderização. Então, em vez de comprimir espaço, objetos, eventos e aparência em um fluxo de pixels, o Project Eden mantém um mundo subjacente funcionando por conta própria. A renderização se torna uma forma de observar esse mundo, não o lugar onde ele é armazenado.

Como Funciona: Três Camadas

Um único gerador de vídeo fazendo tudo é substituído por três camadas, cada uma com uma função clara.

Um estado estruturado em evolução. É aqui que o mundo vive. É uma representação compacta — não uma enorme nuvem de pontos 4D — que rastreia geometria aproximada, identidade dos objetos, semântica e o que suas ações fizeram. Objetos que saem do quadro não são descartados. As mudanças são registradas e permanecem.

Uma interface de estado para observação. Quando uma perspectiva precisa ser renderizada, essa camada converte o estado do mundo em pistas condicionadas pela câmera: geometria local, semântica, mudanças recentes. Cada ponto de vista extrai da mesma fonte, então câmeras diferentes permanecem fisicamente consistentes.

Renderização neural generativa. O renderizador recebe essas pistas e produz o que você vê: iluminação, textura, materiais, fumaça, fogo, água, movimento. Ele não precisa lembrar o mundo — só precisa mostrá-lo.

O Que o Eden Pode Fazer

Separar o estado da renderização abre possibilidades que o vídeo puro ou o 3D estático não conseguem oferecer juntos.

Os objetos não desaparecem quando saem do quadro. Eles permanecem no estado subjacente, então você pode olhar para outro lado por quanto tempo quiser e o mundo ainda estará lá quando você voltar. Na nossa demonstração de extinção de incêndio, apagar o fogo não é um efeito passageiro. O ambiente entra em um estado alterado e o mantém.

A física responde a entradas variadas. Pilote um barco ou dirija um carro, e a ação é registrada no estado e atualiza a dinâmica.

Os mundos são reutilizáveis e editáveis. A geração de vídeo segue em uma única direção — uma vez que a linha do tempo avança, você não pode voltar atrás. O Eden permite que você aja sobre um mundo em execução repetidamente. Deixe uma marca, mova um objeto, acione um resultado, e ele persiste. Outras pessoas que entram nesse mundo veem as mesmas mudanças.

O multijogador é nativo. Muitos agentes compartilham um único estado compacto, com uma visão separada renderizada para cada câmera. Na demonstração de corrida, dois carros compartilham uma pista sincronizada por ângulos diferentes. Na demonstração de campo de tiro, jogadores diferentes realizam ações diferentes no mesmo ambiente, e o Eden as resolve sob as mesmas regras.

Ele pode treinar agentes. Um mundo com física estável, consistência temporal e memória de longo prazo funciona como ambiente para treinar e testar IA incorporada, onde as ações têm resultados confiáveis e o mundo não reinicia a cada olhar.

Por Que Isso Importa

O Eden atende a dois públicos. Para criadores, é um motor para conteúdo interativo: gere um ambiente, configure interações, convide pessoas para o mesmo espaço persistente. Para pesquisadores, é uma base de simulação com consistência de longo horizonte, regras físicas reais, cenários editáveis e consequências mensuráveis — exatamente o que agentes incorporados precisam para aprender de forma confiável.

É por isso que não classificamos modelos de mundo como geração de vídeo. Um modelo de mundo precisa de um estado que possa mudar.

O Que Vem a Seguir

Esta é uma prévia de pesquisa, não um modelo de mundo de uso geral finalizado, e o trabalho ainda está em estágio inicial. Estamos desenvolvendo física mais rica, ambientes maiores, exploração de ponto de vista livre mais ampla, interação com objetos mais refinada e um Modelo de Transição de Estado mais robusto que atualiza o mundo a partir de ações, regras e feedback. A avaliação também precisa crescer — testando persistência, consistência causal, seguimento de regras e sincronização entre múltiplos agentes, não apenas qualidade visual.

Passar de prever o próximo pixel para simular o próximo estado não é apenas uma mudança de engenharia. Aponta para uma IA capaz de criar, lembrar e raciocinar dentro de mundos que se sustentam.

Leia o artigo completo, com demonstrações e detalhes de arquitetura, na prévia de pesquisa do Project Eden.

Sobre a VAST AI Research: A VAST AI Research desenvolve modelos de fundação 3D e modelos de mundo. Saiba mais em tripo3d.ai/research e siga @vastairesearch.

Compartilhar o artigo

Gere qualquer coisa em 3D

Clique abaixo para se juntar a milhões de criadores 3D. Experimente a geração de modelos de altíssima fidelidade e texturas PBR de primeira linha.