Desenvolvimento de Demo de Jogo Solo em Duas Semanas: Como Ferramentas de IA + Unreal Gerenciam o Pipeline Completo

Introdução

A IA impulsionou o desenvolvimento de jogos independentes. Nas últimas duas semanas, combinei o Unreal Engine 5 com um conjunto de ferramentas de IA para criar um protótipo jogável de um jogo de tiro sobre trilhos (on-rails light-gun) — sozinho. Desde o brainstorming e arte conceitual até o código, SFX e música, a IA lidou com o trabalho pesado para que eu pudesse manter o foco e as ideias fluindo, em vez de me afogar em tarefas repetitivas.

Há um vídeo rápido do processo de construção abaixo; o guia completo está no final da postagem.



Kit de Ferramentas de IA

  1. Planejamento: ChatGPT + Gemini para ideias e o documento de design inicial
  2. Arte: DeepSeek + Midjourney para conceitos e guias de estilo
  3. Programação: ChatGPT como um treinador de Blueprint ao vivo
  4. Áudio: modelos generativos de música + efeitos sonoros
  5. Narração (Voice-over): TTS para diálogo em tempo de execução
  6. Modelagem 3D com IA: Tripo

Em resumo: a IA tocou em todas as etapas, transformando um projeto típico de várias pessoas em um sprint de um homem só.

Configuração do Projeto

Por Que Este Jogo?

Perguntei a mim mesmo o básico logo de início: Qual é o ciclo principal? Por que é inovador? Onde será lançado?
A inspiração veio daqueles vídeos engraçados de "DOOM x Animal Crossing", do crossover Fall Guys / DOOM, e do jogo de tiro sobre trilhos Castlevania para arcade. As misturas (mash-ups) geraram uma ideia: misturar tiro sobre trilhos com combate corpo a corpo. Os jogadores percorrem um caminho predefinido, atiram em inimigos distantes com uma arma de luz, e então sacam uma espada laser para cortar ou defender qualquer coisa que se aproxime demais. É uma combinação que raramente se vê em jogos de tiro sobre trilhos clássicos e perfeita para um escopo de duas semanas.

Orçamento de Tempo

Depois que o conceito se encaixou, joguei o rascunho no Gemini e deixei-o me dar um cronograma diário. Foi perfeito? Não. Mas me deu uma base sólida e economizou horas de organização de calendário. Mantive uma lista de tarefas em tempo real no Tencent Docs e a ajustava todas as noites.
Objetivo Um: Semana 1 = montar um pequeno nível MVP que prove o ciclo de arma-mais-sabre.

Destaques do Documento de Design

Ciclo Principal

  • Mundo cyberpunk fofo
  • Jogador desliza sobre trilhos
  • Atira em alvos distantes, corta ou defende ameaças próximas
  • Acumula combos, sobrevive até o chefe

Detalhamento do Sistema

  • Trilhos e Câmeras: Sequencer controla movimento e cortes, estilo "montanha-russa"
  • Entrada / Combate: Clique para atirar, clique e arraste para balançar o sabre
  • Armas: Arma modular + sabre, cada um com seu próprio cooldown e lógica de acerto
  • Inimigos: Arquétipos expansíveis (corpo a corpo, voadores, bullet-hell, elites, chefe) vinculados a eventos do Sequencer

A primeira versão do Gemini ficou pronta em algumas horas, em vez de dias, e me deu uma lista de verificação clara para atacar.

Ciclo de Jogabilidade Central

  1. O jogador se move ao longo de um trilho fixo.
  2. Inimigos aparecem ao longo do caminho de acordo com um script.
  3. Use a arma de luz para eliminar ameaças distantes e aéreas.
  4. Quando os inimigos se aproximam ou disparam projéteis defensáveis, troque para a espada laser para cortar ou para defender perfeitamente os tiros.
  5. Leia a situação e alterne rapidamente entre atirar e cortar para lidar com grupos mistos de inimigos.
  6. Mantenha a ação, acumulando pontos e multiplicadores de combo até o fim da fase ou a aparição de um chefe.

Cada nível segue este arco: escaramuças leves dão o pontapé inicial, a dificuldade aumenta e tudo culmina em uma luta contra o chefe para um final apertado e cheio de energia.

Verificação de Viabilidade do MVP e Controle de Escopo

Antes de escrever uma única linha de código, joguei a lista de recursos principais no ChatGPT para uma verificação de sanidade. A IA voltou com um plano de MVP que resumiu tudo a um único nível curto — apenas o suficiente para provar que o tiro sobre trilhos mais o combate corpo a corpo realmente são divertidos.
Isso se alinha com a mentalidade de "iterar rápido": domine a menor parte primeiro, depois expanda. Eu uso uma regra de bolso: se você pode prototipar uma mecânica em um dia, um jogo completo em torno dela levará cerca de um ano; dois dias de prototipagem significam mais perto de dois anos de produção, e assim por diante. Em outras palavras, mantenha a construção de teste pequena o suficiente para terminar em alguns dias, para que toda a demo possa ser concluída em duas semanas.
Em resumo: a missão da Semana 1 era um nível simplificado que fixasse o ciclo principal de atirar e cortar.

Arte e Áudio

Para definir a atmosfera musical do jogo rapidamente, inverti a ordem usual — música primeiro, visuais depois. Recorri ao Suno AI, uma poderosa ferramenta de música generativa que escreve e canta faixas completas a partir de qualquer letra e estilos que você fornece.

Um truque legal: o Suno permite que você insira "meta tags" diretamente nas letras, entre colchetes — coisas como [Intro], [Male Voice], [Interlude], [Female Voice], [Guitar Solo]. Essas tags direcionam a estrutura da música, vocais, instrumentação e gênero (pop, eletrônico, o que for) para um ajuste fino instantâneo. O catálogo completo de tags está no site do Suno.
Veja como eu o usei:

  • Pedi ao DeepSeek para gerar um pequeno conjunto de letras.
  • No prompt, marquei o estilo como "Electronic" e "Solo vocal."
  • O Suno retornou vários rascunhos com zumbidos — layouts completos de verso/refrão em diferentes estilos.


Prompt: Imagine que você é um compositor. No estilo de "Not Like Us" de Kendrick Lamar, escreva uma música chamada "Cute Bomber." Por favor, forneça:

  1. A letra completa.
  2. Os detalhes da trilha sonora, expressos como palavras-chave do Suno AI (gênero, humor, instrumentos, meta-tags, etc.).

Após um teste A/B rápido, peguei o segmento eletrônico mais impactante como tema provisório. A faixa ainda precisa de uma passagem humana para mixagem e polimento, mas o Suno AI me permitiu acertar a direção musical em tempo recorde.

Mundo e Estilo Visual

Busco uma fusão de brilho sci-fi e fofura de desenho animado de sábado de manhã. Imagine soldados futuristas em estilo chibi batalhando contra uma invasão infernal em uma cidade cibernética neon — adorável na superfície, mas ainda repleta de ação de alta octanagem.
Pontos de referência de estilo: as formas animais arredondadas e as paletas brilhantes de Fall Guys, fundidas com a sinalização e circuitos cyberpunk de brilho intenso. Misture esses ingredientes e você terá um campo de batalha colorido como um doce, que é igualmente encantador e elétrico.

Arte Conceitual

Para arte conceitual, utilizei o DeepSeek e o Midjourney:

  1. Prompts do DeepSeek: Forneci minha visão ("arredondamento de Fall Guys encontra detalhes cyber-mecânicos") e ele gerou prompts ricamente detalhados para o Midjourney.
  2. Output do Midjourney: Inseri esses prompts e obtive fichas de personagem precisas. Ao adicionar "três vistas, frente, lado, trás" a cada prompt, o Midjourney entregou turnarounds completos de uma vez — perfeito para manter a consistência dos detalhes de design ao passar para a modelagem 3D.

Teaser Cinematográfico

A arte conceitual estática foi apenas o começo — também montei uma cinemática de abertura de prova de conceito. Tudo se juntou com um revezamento de ferramentas de IA:

  1. Roteiro e Storyboard
  • O DeepSeek redigiu o roteiro da cena, definindo o cenário, os ritmos e as tomadas-chave.
  • Enviei esse texto para o Midjourney, que gerou uma sequência de ilustrações que serviram como painéis de storyboard.
  1. Geração de Vídeo
  • Esses quadros foram, quadro a quadro, para o Kling — uma ferramenta chinesa de vídeo com IA que lida com imagem-para-vídeo e texto-para-vídeo.
  • Usando dicas de prompt para movimentos de câmera e transições, o Kling transformou as imagens estáticas em clipes de animação suaves e conectados. (Na época, superou opções como o OpenAI Sora para minhas necessidades.)
  1. Design de Som
  • Com os clipes silenciosos em mãos, iniciei um fluxo de trabalho local do ComfyUI executando o modelo MMAudio.
  • Alimente-o com a filmagem mais um prompt como "rua futurista da cidade sob ataque", e ele gera um ambiente em camadas — sirenes, zumbidos de mechs, carregamentos de armas de energia. (Dica: gere trechos de ~10 segundos; o MMAudio adora uma GPU com 16 GB de VRAM ou mais.)
  1. Mixagem Final
  • Coloquei o rascunho do tema do Suno, o vídeo do Kling e os SFX do MMAudio no meu editor, sincronizei tudo e fiz uma mixagem rápida.

Poucas transferências de IA depois, o trailer conceitual estava pronto — definindo a atmosfera audiovisual do jogo com uma fração do esforço usual.

Preparação Técnica

Controle de Versão

Mesmo como desenvolvedor solo, criei um repositório SVN no meu NAS doméstico — apenas um contêiner Docker e pronto. O Unreal Engine funciona bem com SVN, a configuração é indolor e ele lida com os arquivos binários pesados que vêm com projetos de jogos.
Com o controle de versão adequado, posso criar branches à vontade, definir checkpoints e experimentar sem medo. Reversões e diferenças são instantâneas, o que importa ainda mais quando você está usando Blueprints — o editor do UE5 tem suporte a diferenças integrado. Um controle de origem sólido é a rede de segurança que torna a iteração rápida possível.

Sequencer como Espinha Dorsal da Jogabilidade

Como este é um jogo de tiro sobre trilhos, o Sequencer do UE5 está no centro de tudo. Analisei seu sistema de gatilho de eventos e confirmei que ele serve para mais do que cutscenes — pode executar a jogabilidade momento a momento com precisão de quadro, o que é exatamente o que um jogo de tiro com foco em ritmo precisa.
A linha do tempo controla o caminho do jogador no trilho e cada corte de câmera. Keyframes dentro de um ativo Level Sequence fixam a posição e a rotação, então a visão desliza ao longo de uma rota predefinida e faz transições limpas entre os ângulos — sem necessidade de código extra.
Também preciso do Sequencer para disparar momentos de jogabilidade — gerar inimigos, iniciar animações, o que for. A solução: trilhas de eventos personalizadas. Coloque um marcador "EnemySpawn" ou "MonsterAttack" na linha do tempo, vincule-o a um evento personalizado no Blueprint do nível, e quando a reprodução atingir esse quadro, a lógica do jogo dispara automaticamente. Isso transforma o script de nível em um fluxograma visual e facilmente ajustável.

Verificação do MVP

Fiz outra verificação de viabilidade — misturando minha própria experiência com os conselhos do ChatGPT — e defini a abordagem técnica. A principal dica do ChatGPT foi: construa o menor loop possível primeiro para provar a combinação de tiro e corte. Nosso MVP: um nível curto com movimento em trilho, alguns inimigos e uma luta contra um chefe.
No UE5, criei esse protótipo rapidamente. O Sequencer controlava o trilho em primeira pessoa, eventos da linha do tempo geravam inimigos que se aproximavam, e o jogador os abatia. Assim que o loop rodou suavemente, tive dados reais sobre ritmo, dificuldade e diversão — então pude encarar o desenvolvimento completo com confiança.



Codificação em Blueprints

Controlador de Trilho

Controlador do Jogador e Movimento em Trilho
O jogador não tem movimento livre — em vez disso, ele está "preso" a um trilho predefinido. Criei uma subclasse de Character, mas entreguei todo o movimento ao Sequencer. Em um ativo Level Sequence, os keyframes controlam a Localização e Rotação do Pawn ao longo do tempo. Vincular essa Sequência ao jogador move e gira automaticamente ao longo do caminho. Também conectei várias câmeras à mesma linha do tempo para que a visão mude suavemente sem código extra.
Sistema de Combate
A entrada é simples: clique esquerdo para atirar, segure e arraste para balançar a espada laser.

  • O Tiro usa um line-trace do centro da câmera em direção ao retículo; acertos chamam a lógica de dano do inimigo.
  • O Combate corpo a corpo monitora o movimento de arrastar, o converte em um arco de corte na tela e verifica inimigos dentro desse arco para disparar acertos ou defesas.

As armas residem em dois componentes Blueprint — um para a arma (trace, VFX, dano) e um para a espada (detecção de arco, VFX de corte, bloqueio/defesa).
Inimigos e Lógica de Nível

Criei quatro classes de inimigos: soldados corpo a corpo, voadores, voadores de longo alcance e um chefe. Os três primeiros funcionam com AIControllers com Behavior Trees — uma vez que você os gera, a árvore lida com as decisões de movimento e ataque. As fases e ataques especiais do chefe são controlados diretamente por eventos do Sequencer para um timing preciso.
Para sequenciar o nível inteiro, criei um ator LevelPoint (subclasse de LevelSequenceActor). Você posiciona múltiplos LevelPoints ao longo do trilho; cada um tem seu próprio ativo Sequence para gerar inimigos, tocar falas, tremores de câmera, etc. Um LevelPoint define seu próximo nó (ou ramifica com base em condições). Quando o jogador atinge um LevelPoint, sua Sequence é reproduzida; uma vez que sua condição de vitória é atendida (todos os inimigos abatidos ou o tempo esgotado), o sistema pula para a Sequence do próximo LevelPoint. Até adicionei trilhas personalizadas ao Sequencer para que ele possa verificar o estado do jogo e decidir quando avançar — tornando todo o fluxo um storyboard modular e visual de "nó + linha do tempo".

Scripting de Blueprint Assistido por IA
O ChatGPT era minha ferramenta sempre que surgia uma dúvida sobre Blueprint ("Como faço para gerar inimigos a partir de um evento do Sequencer?" "Como converter o arrasto do mouse em um acerto corpo a corpo?"). Ele fornecia respostas passo a passo, apontava para documentos ou posts em fóruns, e até esboçava nós pseudo-Blueprint.
Por exemplo, quando perguntei como ajustar um material em tempo de execução, ele me disse para usar um nó "Create Dynamic Material Instance" e me lembrou de armazenar a referência. Alguns cliques depois, meus golpes de espada laser iluminaram os inimigos exatamente como planejado.
Ter um "consultor técnico" de IA disponível eliminou obstáculos e aumentou a velocidade e a confiança. Seus conselhos às vezes precisavam de um ou dois ajustes, mas no geral ele lidou com inúmeros pequenos detalhes para que eu pudesse continuar construindo.

Ativos

UI

A UI precisava combinar com o visual cyberpunk fofo do jogo. Usei o GPT-4o para gerar recursos de arte planos e in-game no estilo "Splatoon" — fornecendo-lhe prompts claros (imagens de referência, cores, notas de layout, descrições de texto) e iterando até obter um conjunto de peças de UI com estilo grafite neon (por exemplo, barras de vida/energia estilo pipeline, painéis de pontuação chamativos).

A geração de imagens do GPT-4o (lançada em março de 2025) provou ser poderosa, mas imperfeita:

  • Prós: curva de aprendizado baixa, rápida e flexível; suporta texto-para-imagem, imagem-para-imagem, consistência multi-imagem; ótima para ícones, transferências de estilo, arte de apresentação.
  • Contras: limites de comprimento do chat podem truncar o contexto; detalhes finos frequentemente se desviam (não ideal para mockups precisos); limites de resolução exigem costura manual para turnarounds; a complexidade do prompt ainda tem casos de borda (embora imagens de referência ajudem).

No geral, o GPT-4o é um divisor de águas — as ideias agora superam os obstáculos técnicos, e um novo fluxo de trabalho impulsionado por IA para design de UI 2D está emergindo.

SFX

  • Efeitos Sonoros: Usei a plataforma de geração do Stable Audio para criar tiros, explosões, rugidos de monstros e muito mais a partir de prompts simples como "máquinas mecânicas desligando" ou "espada laser cortando o ar". Executá-lo localmente acelerou a iteração.
  • Música de Fundo: Para o protótipo, usei o tema eletrônico do Suno AI como um placeholder.

Modelos 3D

  1. Gerar: Midjourney três vistas ➜ Tripo 2.5 para auto-mesh e retopo
  • Alimentei os turnarounds de três vistas do Midjourney no Tripo 2.5, que automaticamente retopologiza e converte arte 2D em uma malha 3D básica com texturas em minutos. A topologia é sólida e a silhueta corresponde ao conceito. Seu auto-rigging não é perfeito — tamanhos e orientações de ossos precisam de ajustes — mas reduziu o tempo de modelagem e UV.
  1. Rig: Esqueleto de um clique AccuRIG do Character Creator
  • Em seguida, importei a malha para o Character Creator e executei sua ferramenta AccuRIG para gerar instantaneamente um esqueleto e pesos de skin.
  1. Animação: iClone 8 para retarget da biblioteca de movimentos; a assistência de pose por IA é ouro
  • Para animação, usei o iClone 8: sua biblioteca de movimentos, retargeting de motion capture e assistência de pose por IA me permitiram aplicar reações de corrida, tiro, corte e impacto em minutos, em vez de animar manualmente. Exporte os clipes como FBX e os trouxe para o Unreal.
  1. Importar: FBX de volta para UE5

Graças a este pipeline de IA — conceito → malha 3D → rig → animação — um processo que normalmente leva semanas foi feito em dias.

Design de Nível

Assistente de IA

Pedi ao Gemini para estudar o fluxo do Castlevania de arcade e gerar um roteiro de nível baseado em nós. Sua análise — intro → mobs → mid-boss → mais mobs → final boss — capturou a essência, até especificando tipos e contagens de inimigos em cada fase. Depois, ajustei esse script para se adequar ao meu próprio design e finalizei o plano de nível.

Design de Nível e Sistema LevelPoint

Usei o sistema LevelPoint para montar o nível, colocando nós de evento ao longo do trilho do jogador. Cada LevelPoint se conecta à sua própria Level Sequence no Sequencer, onde você coreografa tudo — surgimento de inimigos, tremores de câmera, diálogos, etc.
Por exemplo:

  • No LevelPoint1, sua Sequence reproduz um mini-clímax — ondas de inimigos, um tremor de câmera, uma fala. Quando o jogador atinge esse ponto, a Sequence dispara e a luta começa.
  • Assim que esses inimigos são derrotados, o trilho leva você ao LevelPoint2, cuja Sequence pode exibir uma cutscene e um pequeno encontro com um chefe.
  • Isso se repete até o chefe final e o encerramento do nível.

O método "nó + linha do tempo" transforma o design de nível em uma edição visual: para ajustar o ritmo ou adicionar um evento, basta inserir, remover ou ajustar os marcadores de evento no Sequencer.

Diálogo Dinâmico

Construí um sistema de diálogo em tempo real em vez de usar scripts de voz fixos. Em cada nó da história, a IA cria uma nova fala e então a convertemos para TTS.



Veja como funciona:

  1. Integrar plugin AIITK• Instalei o AIITK (AI Integration ToolKit) do Unreal para expor chamadas GPT em Blueprints.
  2. Definir API e modelos de prompt• Conectar o endpoint OpenAI GPT-4.• Criar modelos de prompt para diferentes contextos (combate normal, batalhas de chefes, etc.).
  3. Gerar texto em tempo de execução• Quando o jogador atinge um LevelPoint, o Blueprint chama o AIITK com o prompt apropriado.• O GPT-4 retorna JSON com legendas em chinês e uma versão em inglês para voz.
  4. Sintetizar fala• O Blueprint envia a linha em inglês para a API TTS da OpenAI e recebe um WAV.• O Blueprint então reproduz o áudio enquanto exibe a legenda em chinês.

Fluxo de Geração de Diálogo

  1. Linhas: Em cada LevelPoint, o AIITK chama o GPT com o prompt e o contexto, retornando o diálogo em chinês mais uma versão em inglês em JSON.
  2. Síntese de voz: Analisar o JSON, pegar a linha em inglês, enviá-la para a API TTS e receber um WAV.
  3. Reproduzir e exibir: O componente de áudio do Unreal reproduz o WAV enquanto a UI mostra a legenda em chinês.

Tudo isso acontece em segundos, então cada jogada oferece falas novas sem nenhum roteiro escrito à mão ou voz gravada.
Desafios e Ajustes

  • Prompts importam: Seja preciso, mantenha as falas curtas, divida chats de várias linhas em chamadas separadas.
  • Mantenha a consistência: A IA pode se desviar do modelo. Reforce detalhes de cenário e personagem em seus prompts.
  • Não atrase o jogo: Execute as chamadas de IA durante telas de carregamento ou cutscenes para que os jogadores nunca esperem.

Conclusões

  • Vantagem da IA: Em 14 dias, a IA me permitiu ir do zero a uma demo funcional — lidando com arte, código, áudio e muito mais — para que eu pudesse manter o fluxo criativo em vez de trabalho repetitivo. Dirigir a IA é a nova arma secreta.
  • Limites da IA: A IA ainda precisa de supervisão humana. Documentos, arte, código e diálogo exigiram ajustes. Uma boa elaboração de prompts é metade da batalha.

Fluxo de Trabalho Completo do Protótipo



Traduzido e republicado com permissão.

Advancing 3D generation to new heights

moving at the speed of creativity, achieving the depths of imagination.