Inworld AI NPC GDC 2024 prático – NVIDIA e Ubisoft mostram um vislumbre do futuro
O avanço das redes neurais nos últimos anos tem sido significativo, começando com o desenvolvimento inicial de Transformadores Gerativos Pré-treinados. Com a melhoria contínua das placas gráficas e Tensor Cores da NVIDIA, as capacidades dessas redes aumentaram bastante. No passado, essas redes eram usadas principalmente para entradas baseadas em texto, mas a NVIDIA agora incorporou o TensorRT para aprendizado profundo e processamento de áudio. Durante duas demonstrações interativas com a tecnologia Inworld AI na GDC 2024, pudemos testar os recursos dos NEO NPCs da Ubisoft e do Covert Protocol da NVIDIA.
Pergunte a qualquer Mestre que liderou uma sessão de Dungeons & Dragons da qual participei nos últimos dez anos: o aspecto mais agradável é ultrapassar os limites da campanha (e a própria bússola moral). Em ambas as demonstrações, recebi controle total da experiência por meio de comandos de voz, enquanto meu treinador observava do lado de fora, possivelmente fazendo anotações ou pensando em encerrar a sessão. Quando pude experimentar o programa NEO NPCs da Ubisoft, já havia consumido minha segunda xícara de café antes das 10h e estava cheio de ideias para menores de 13 anos.
Durante minha experiência prática com a demonstração Inworld da Ubisoft Paris, tive a oportunidade de testar a poderosa combinação do AI Character Engine da Inworld e das animações faciais automáticas Audio2Face da NVIDIA. O conceito de “autenticidade” foi enfatizado diversas vezes durante minha sessão e descobri que era bastante preciso. Os desenvolvedores tiveram o cuidado de manter a ilusão de serem recrutados por um citadino de gorro chamado Bloom para “a resistência” através do uso de grades de proteção.
A Ubisoft utilizou uma lista pop-up para incorporar a gamificação à experiência Inworld AI. Esta lista recomendava diversas atividades, como aprender sobre as megacorporações e a resistência, para serem realizadas em um nível holístico. Apesar das minhas tentativas de direcionar a conversa para outro lugar, Bloom sempre trazia à tona essas barreiras invisíveis e fazia comentários espirituosos sobre minhas investigações antes de redirecionar o foco de volta para a resistência. Minhas ações, ou melhor, minhas palavras, foram recebidas com uma resposta persistente durante toda a manifestação. Quando mencionei minhas habilidades únicas como barista e entusiasta de criptografia, preferindo usar o nome de Poncho em vez de Nelson, Bloom ficou feliz em atender e trocamos anedotas antes de concluir com meu objetivo final de obter informações sobre o propósito da demonstração.
A segunda parte da demonstração passou para uma sessão aberta de brainstorming com Iron, uma proeminente membro feminina da resistência que parecia ocupar uma posição mais elevada do que Bloom. Meu objetivo desta vez era criar estratégias para me infiltrar em um cofre. Enquanto eu navegava pela sala de briefing virtual com um controlador em mãos, a Ubisoft me apresentou listas e palavras-chave para estimular a discussão e incentivar a colaboração com Iron na busca de uma solução para uma invasão discreta após o brunch.
Apesar de ter todas as ferramentas necessárias à minha disposição, procurei montá-las de formas menos convencionais. Embora uma escada fosse uma opção prática para acessar um prédio no segundo andar, desafiei-me a pensar fora da caixa e usá-la para chegar a uma câmera de segurança no corredor. Ao pendurar uma foto Polaroid do corredor vigiado, consegui enganar a câmera e conseguir entrar. Derrubar o guarda que bloqueava meu caminho da varanda de entrada para o escritório foi uma tarefa facilmente realizada por qualquer jogador de Metal Gear Solid, mas transmitir meu plano através de comandos de voz provou ser um desafio. Minhas tentativas de convencer Iron a carregar um gancho em uma espingarda ou confiar na tática exagerada de entrar furtivamente em uma caixa de papelão foram inúteis. Eu estava determinado a
A demonstração do Covert Protocol apresentada pela NVIDIA foi uma experiência mais desestruturada, com o objetivo de descobrir o número do quarto de uma pessoa de interesse hospedada em um luxuoso hotel cinco estrelas. Minha história de capa escolhida foi a de um mensageiro que transportava mercadorias ilícitas que exigiam assinatura direta para liberação. Achei o primeiro personagem não jogável que encontrei, um carregador, muito mais receptivo às minhas sugestões do que Bloom e Iron. Embora nossas conversas fossem em sua maioria reacionárias, ele parecia aberto à ideia de uma massagem nos pés ou de sair para um karaokê quando minha missão estivesse concluída. Apesar das minhas tentativas, não consegui convencer a IA a cantar músicas no local, mas ele mencionou que sua música preferida no karaokê era
Os outros dois NPCs de IA não foram tão flexíveis em suas respostas e não pareciam interessados em interagir com alguém fora da história. No entanto, tudo mudou quando me deparei com um crachá de trabalho ao lado. Assim que o obtive, ambas as personalidades da IA tornaram-se mais receptivas aos meus pedidos e forneceram informações valiosas relacionadas ao meu objetivo. Essa mudança repentina de comportamento foi um pouco chocante e prejudicou a experiência imersiva. Embora eu entenda a necessidade de objetivos no jogo, parecia restritivo ser forçado a realizar tarefas específicas em vez de ter a liberdade de interpretar e fazer escolhas.
Apesar do aparente absurdo dos meus pedidos, desde que eu mantivesse as minhas investigações dentro dos limites da PG-13 e evitasse qualquer coisa verdadeiramente obscena, os modelos de linguagem estavam mais do que dispostos a cumprir e muitas vezes respondiam com comentários inteligentes e instigantes. A qualidade geral da experiência com esses personagens e modelos de linguagem depende, em última análise, do treinamento que eles recebem e do poder de processamento necessário para interpretar solicitações não convencionais. Tanto a Ubisoft quanto a NVIDIA demonstraram suas abordagens únicas para criar conversas realistas com os jogadores, mantendo os limites, o que pode ser benéfico para futuras integrações de jogos. Resta saber se essas ferramentas serão implementadas antes do fim da atual geração de consoles, mas meu ceticismo inicial foi substituído pela curiosidade e entusiasmo pelo potencial dos NPCs alimentados por IA.
Deixe um comentário